Спасибо всем ответившим, и извиняюсь за задержку с ответом - могу отвечать только из дома поздно вечером.
Дело в том, что я уже пару лет работаю в небольшой фирмочке, специализирующейся на обработке почтовых адресов в интересах заказчиков - издательств, рекламных агентств и фирм, продающих товары по почте. Как правило, заказчик предоставляет нам адреса своих клиентов/абонентов, а также купленные или взятые в аренду у др.фирм. Мы конвертируем адреса из TXT или XLS в DBF, выполняем визуальный контроль и предварительную обработку в интерактивном режиме в VFoxPro - удаляем "мусор", меняем структуру данных на б/м удобоваримую, при необх. селектируем по опр.критериям (пол, индекс, регион), корректируем опечатки/ошибки etc. А дальше различные списки адресов в DBF-формате запускаются в спец.программу, которая их фонетически кодирует и на основе нечеткой логики находит и выкидывает дубли адресов. Т.о. можно вычистить свои базы данных от неплательщиков, от "робинзонов" (не желающих получать рекламу), выделить из покупных/арендованых адресов только те, которых в собственной базе не имеешь, ну и т.д. Clean-адреса и дубли снова интерактивно контролируются в VFP, при необходимости повторяется с др.настройками. Дальше они либо уходят к заказчику, либо проходят дальнейшую обработку - выявляются переехавшие и умершие, оптимизируются для почтовой логистики и идут в типографию для печати/рассылки каталогов и/или рекламы.
Все работает беспроблемно, пока CP=1252 или 850. А тут один наш постоянный заказчик, видимо имеющий хорошую почву в России (или пытающийся создать таковую), запросил у нас, сможем ли мы провести подобную сверку адресов на кириллице, и прислал для пробы пару сотен адр. на UTF-8 (оказывается).
Программа сверки кириллицу не переваривает в принципе, есть мысля сделать транслитерацию РУС-->ЛАТ и попробовать. Имеются слухи :-), что VFP v.9 безпроблемно работает если не с UTF, то хотя бы с CP-1251. Так шта будем думать. Должны быть уже готовые конверторы UTF<->1251 (EditPad), 1251<->LAT (RusFon и т.п.), накрайняк сами напишем кодировшик.
15 лет назад я беспроблемно работал с FoxPro в России. Тогда это была одна из наиболее массовых DB-программ. Я просто уверен, что и сейчас сотни тысяч пользователей и программеров в России по-прежнему пользуют его последние (и не очень) версии. Должны быть и программы для сверок адресов, ну не верю я, что нету такого в России...
[...падал прошлогодний снег...]
Это сообщение редактировалось 07.03.2008 в 00:08