Разметка текстовой базы данных для NLP AI

Гость3 года в сервисе
Данные заказчика будут вам доступны после подачи заявки
31.05.2022

Кого мы ищем: Assessor для разметки датасета.

Требования к исполнителям:

1. Отличное владение английским языком. Желательно носитель, либо свободное владение. (подтвержденный С1 и выше)

2. Обязательно опыт в разметке датасетов. Участие хотя бы в 2-3 проектах по разметке NLP датасетов.

Необходимо разметить 1000 заданий (примеров), где:

• задание (пример) представляет собой набор из шести статей (новостей).

• разметить, значит – определить является ли первая (базовая) статья уникальной, или последующие статьи повторяют её по смыслу. То есть, надо отметить, какие из пяти последующих статей совпадают по смыслу с первой (базовой) статьёй.

• сравнивать нужно только первую (базовую) статью с каждой из пяти последующих. Последующие статьи между собой сравнивать не нужно.

• статья представляют собой информационный материал (новость) на английском языке, длиной, в среднем, в 500 слов.

Пример формата входящего датасета прилагается.

Заявки фрилансеров