Разработать грамматик для извлечения фактов с помощью Томита-Парсера
Для резюме кандидатов разработать грамматики для Томита-парсера для извлечения соответствующих фактов из текста.
1.Часть задания
1.Фамилия (last_name)
2.Имя (first_name)
3.Отчество (middle_name)
4.Локация (hrpac_cities_id_c)
5.Дата рождения (birth_date)
6.Пол (gender)
7.Желаемая должность (Specialty)
8.Желаемая зарплата + Валюта (Salary + currency_id)
9.Последнее место работы (last_work)
10.Последняя должность (last post)
11.Опыт работы, лет(experience)
12.Средства связи:
Телефон (phone)
E-mail (email)
Telegram (telegram)
Linkedin (linkedin)
Facebook (facebook)
Остальные ссылки в блоке контактов записывать в тип средств связи «Сайт» (site)
13.Навыки кандидата (hrpac_skills_hrpac_candidates)
14.Детальный опыт работы
Место работы (company_name)
Локация компании (company_city)
Сайт компании (company_site)
Специализация компании (company_industry)
Должность (post)
Описание (post_desc)
Дата начала (period_begin)
Дата окончания (period_end)
2.Часть задания
1.Обо мне (about_me)
2.Образование:
Уровень (level_of_education)
Учебное заведение (educational_institution)
Факультет (faculty)
Специализация (specialization)
Год окончания (year_of_completion)
3.Знание языков
Язык (language)
Уровень владения (proficiency level)
4.Повышение квалификации, курсы
Год (year_of_completion_qualification)
Специализация (specialization_qualification)
Организация (organization_qualification)
Учебное заведение (educational_institution_qualification)
5. Сертификаты
Год (year_of_completion_certificate)
Специализация (specialization_certificate)
Организация (organization_certificate)
Учебное заведение (educational_institution_certificate)
6. Гражданство (Citizenship)
7.Разрешение на работу (Work_permit)
8.Желательное время в пути до работы (time_to_work)
9.Рекомендации (Recommendations)
10.Переезд (Move)
11.Готовность к командировкам (Ready_for_business_trips)
12.Занятость (Employment)
13.График работы (Work_schedule)
Выполненным заданием считаем набор Грамматик и словарей и файла конфигурации и файлов описания фактов для извлечения перечисленных фактов из текста и сохранением их в xml файл
Приведен пример резюме, на которое можно ориентироваться в процессе разработки грамматик.