Смысловой разбор текста для бота — заметка #1

Урвал вчера полчаса времени между работой, семьей и  сном на околопрограммирование.

2016-03-15-16-08-36

рисунок, карандаш, робот, Филлиппок

 Обработал список русских фамлий, сформировал правила превращения мужских фамилий в женские.
На очереди — обработка списков мужских и женских имен и формирование из всего этого добра базы данных в формате hdf. В чуть более далекой перспективе — обработка  списка условно «украинских» фамилий и условно «»армянских», не различающихся в зависимости от рода.
Цель — создание модуля определения имени в тексте/сообщении. Нажо будет учесть: полное и сокращенное до инициалов написание и падежи, написание с большой и маленькой буквы. Дальнейшая цель — поиск информации по персоналиям в Интернете и отдельных текстах
Есть небольшие сомнения в правильности использования именно hdf, а не SQL. Hdf, безусловно, проще в мспользовании вместе с Питоном и гораздо быстрее, но тот факт, что я его пока не очень хорошо знаю и информации о нем в рунете не так много, как хотелось бы, по смущает — как бы не вылезло потом чего-нибудь блокирующее, из-за  чего придется все переделывать.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Капча: * Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.