Фрилансеры предложат решение вашей задачи уже через несколько минут!
Публикация заказа не займет много времени.
1 месяц назад
Гость
1 месяц в сервисе
Был онлайн 1 месяц назад
1 месяц назад

Часть 1. Метчинг анализовЧто нужно сделать?Найти одинаковые анализы среди списков анализов 5 разных лабораторий

Сколько это данных?5 лабораторий, у каждой лаборатории ~1500 анализов. Данные, которые доступны про каждый анализ: название + биоматериал. 

Что такое одинаковые анализы?Необходимое условие:
Биоматериалы анализов совпадают, т.е., например, анализы являются одинаковыми, если их биоматериалом является сыворотка крови или кровь с ЭДТА.  

Примечание 1: есть одна лаборатория (CMD), у которой не прописано, что это точно за биоматериал, а прописано только общими словами, например, кровь (в случае с этой лабораторией достаточно совпадения биоматериала с точностью до смысла, т.е. ”кровь” = ”кровь с ЭДТА” или ”кровь” = ”кровь с натрием”)

Примечание 2: биоматериалы у разных лабораторий могут называться по-разному, например, ”кровь с ЭДТА” или ”кровь (ЭДТА)”, но у одной лаборатории названия одинаковых биоматериалов идентичны (я понимаю, что очень легко было привести к единому виду в excel, но у меня как назло полетел офис)

Достаточное условие:
а) анализы, называющиеся одинаково
б) анализы, называющиеся немного по-разному, но обозначающие одно и то же 

Примеры одинаковых анализов:
1) Антитела к кардиолипину (Anticardiolipin antibodies) класса IgM, сыворотка крови
2) Антитела к кардиолипину IgM (Антикардиолипиновые антитела IgM, АКЛ IgM, Cardiolipin Antibodies IgM, aCL antibody IgM, APAs IgM), кровь
3) Антитела к кардиолипину, IgM, сыворотка крови

1) Исследование соскобов с шейки матки и цервикального канала, мазок
2) Исследование соскобов шейки матки и цервикального канала (Examination of Scrapings: Cervix and Cervical Canal ), мазок из влагалища

1) Кобальт (моча), моча
2) Кобальт в моче (Cobalt), моча

Как предполагается искать одинаковые анализы?
Поиск конкретных методы метчинга всегда ваш выбор, но мне кажется, что наиболее эффективно делать следующим образом: искать по словам и/или символам те, которые максимально друг с другом совпадают, а далее руками проверять, действительно ли они одинаковыеВ каком формате хочется увидеть результат?https://docs.google.com/spreadsheets/d/1I9qBzMNoUzLd5WXuo6J1LA70mDEKVVlCaYbkzjfmjQw/edit?usp=sharing

Что является критерием достижения результата?
1) Я бы хотела, чтобы ~70% анализов каждой лаборатории было найдено соответствие хотя бы в двух лабораториях. При этом, этот процент может меняться от лаборатории к лаборатории. Например, у одной лабы ~500 видов анализов, поэтому совершенно точно для 90% можно найти соответствующий хотя бы в одной лаборатории.У другой лаборатории ~2500 анализов, поэтому логично, что иметь соответствия будут вряд ли более 70% анализов
2) Хотя бы для 400 анализов найдено соответствие во всех 5 лабораторияхЭто примерные критерии, которые я выделила, исходя из тех данных, которые видела. Если у вас получится лучше - очень круто, если, наоборот, зайдете в тупик на меньших процентах - присылайте данные, посмотрим

Часть 2. Метчинг чек-апов

Что такое чек-апы?
Это, так называемые, ”комплексные проверки”: паки из нескольких анализов (обычно 10-20), которые клиент сдает единоразово 

Сколько это данных?
5 лабораторий, у каждой лаборатории ~50-100 чек-апов, каждый чек-ап состоит  ~ из 7-15 анализов. 

Что нужно сделать?
Найти все чек-апы, которые совпадают хотя бы на 60% и указать процент совпадений

Как это сделать?
Взять чек-апы одной лаборатории за начало отсчета и найти в каждой лаборатории все чек-апы, совпадающие с данным миниум на 60% ( = содержащие хотя бы 60% одинаковых анализов). Одинаковые анализы определяются из части 1. 

В каком формате хочется увидеть результат?https://docs.google.com/spreadsheets/d/1I9qBzMNoUzLd5WXuo6J1LA70mDEKVVlCaYbkzjfmjQw/edit?usp=sharing

Войдите в аккаунт, чтобы посмотреть приложения к заказу.

Заявки фрилансеров

1 месяц назад
Андрей Закарян
19 лет, Армения
1 год в сервисе
Был онлайн 4 дня назад
1 месяц назад
Ильдар В.
38 лет, Россия
9 лет в сервисе
Был онлайн 1 день назад
ТОП-20 — Прикладное ПО
1 месяц назад
Константин Паньков
47 лет, Россия
10 лет в сервисе
Был онлайн 1 час назад
ТОП-5 — Прикладное ПО
1 месяц назад
Петро Петренко
56 лет, Украина
1 месяц в сервисе
Был онлайн 1 месяц назад
26 дней назад
Алексей Б.
Алексей Б. 
30 лет, Россия
3 года в сервисе
Был онлайн 26 дней назад

Похожие заказы

Графический компонент для Delphi

Хочу графический компонент: TTreeView + TGrid + Сетевой график. Необходимые возможности: Драг-н-дропное редактирование данных (удлинять, укорачивать, обрезать и переносить линейки движением мышки). Возможность изменять временнОй масштаб; Возможность

Создание модуля DLL "Копирование базы данных в архив"

ПОСТАНОВКА ЗАДАЧИ Написать дополнительный модуль для программы, работающей с базой данных mdb (формат Microsoft Access 97). Задача модуля: сделать копию файла базы данных в другой каталог (это будет архив), а из оригинала файла базы данных удалить ст...

Анализатор кода

Требуется написать программу, которая будет работать как демон и делать следующее: 1. Получает информацию из базы данных, MySQL (url-сайта, текст ссылки, url-ссылки) 2. Получает данные по адресу url-сайта (страница c html кодом) 3. В получен

Создание программы обработки данных

Требуется написать программу на любом из языков. Если коротко, то набор объектов описывается неким числом параметров, которые должны заноситься и извлекаться из базы данных (лучше, если MS Access, но варианты рассматриваются). Сопоставляя эти парамет...

Конвертация одной БД в другую

Необходимо конвертировать одну БД в другую. Всего будет 2 БД и их нужно конвертировать в другую. Все БД я предоставляю. Делайте любым удобном для вас способом, но только чтобы я мог потом сам их конвертировать. Т.е. мне не важно будет написано на php...

Нужно сделать 3D программу - визуализатор

У нас есть файл с массивом 3D точек с цветом в каждой точке Реализовано: Триангуляция по этим точкам Совмещение 2х поверхностей Вычесление обьёма между этими поверхностями Есть DLL и тестовая программа которая всё это делает Нужно изпользуя данное,

Срочно нужна помощь в решении задачи на C++

Нужна помощь в решении задачи. Работу нужно сделать в ближайшие 2-3 дня, т.е. не позднее 24.12.2005 ICQ 283-895-859 Разработать программу следующей игры (рабочее название «Аннексия-6»). Игровое поле – область на плоскости, разбитая решеткой, состоя

Требуется разработчик ПО

У меня имеется взаимовыгодное предложение к разработчикам программного обеспечения. Я хотел бы создать виртуальную компанию в интернете по продаже ПО. Распределение прибыли - 50% на 50%. Работа полностью удаленная. Желательно иметь опыт по созданию к...

Требуется программист.

Доброго времени суток, Необходим человек отлично знающий C/C++, ASM. Человек должен знать как распределяется адресное пространство процессов в ХР, структуру РЕ файлов, как происходит загрузка РЕ файлов (досканально), требуется опыт в данной сфере. Зн

Создание оболочки для работы с базами данных

Задача есть следующая. С нуля необходимо сделать оболочку для работы со справочниками, которые являются изначально базами дбф. Для каждого справочника в админке (ее тоже нужно будет сделать) создается классификатор записей по определенным полям, назв...