Реализовать простую нейронную сеть для волонтерского приложения DonorSearch

Упоминание на сайте и/или в соцсетях

Реализовать простую нейронную сеть, которая будет определять по тексту сообщения в волонтерском приложении DonorSearch, является ли это сообщение просьбой о поиске доноров. Входные данные для обучения сети будут предоставляться.

В формате конкурса — в случае качественной реализации планируется долгосрочное сотрудничество с оплатой

Детали: Имеется программа, которая собирает новости ВКонтакте, содержащие ключевые фразы, типа "нужен донор", "Нужна кровь" и так далее. При этом зачастую попадаются и случайные новости, не имеющие отношение к просьбам о поиске доноров.
Этот массив сообщений на данный момент обрабатывается вручную волонтерами посредством приложений ios, android и ВК.
https://vk.com/app3356338
https://itunes.apple.com/ru/app/id603318106?mt=8
https://play.google.com/store/apps/details?id=ru.donorsearch.volunteers

Нужно создать нейронную сеть, что используя обработанные волонтерами сообщения с реальными просьбами и прочими сообщениями, сможет сама отличать с высокой вероятностью реальные просьбы от случайных . В том числе выявлять просьбы о поиске доноров для домашних животных, а также мошеннические просьбы.

Помощь нужна
Руслан Шекуров

Руслан Шекуров

Об организации / проекте

DonorSearch — Социальная сеть доноров крови

DonorSearch — Социальная сеть доноров крови. Интернет-проект, мотивирующий к регулярным безвозмездным кроводачам. Найди в себе супергероя — донора крови!

Миссия проекта — обеспечение донорской кровью всех потребностей учреждений здравоохранение в каждом городе РФ и СНГ, а значит спасение тысячей жизней.

Для достижения этого необходимо, чтобы каждый день в каждый центр крови приходило ровно столько доноров, сколько может принять центр, и чтобы это были доноры, обладающие именно теми параметрами крови, которые требуются в данном центре крови в текущий момент.
Разумеется, мы понимаем, что это идеальная модель. Но это именно то, к чему мы стремимся.

С нами легко и удобно вести учет и планирование кроводач, а также узнавать, где именно и в какие дни есть особая нехватка донорской крови в каждом городе. Сделай вклад в общество — становись донором вместе с нами, спасай жизни, получай бонусы и привилегии от партнёров проекта, делись своими достижениями в спасении жизней и будь примером другим!
Вместе делаем одно хорошее дело!

Комментарии
  1. Артем Лабунский
    Артем Лабунский /

    Какая примерно точность (в % от n — общего числа входных данных для обучения) требуется? И принципиально ли использование именно нейронных сетей?

  2. Андрей Огурцов
    Андрей Огурцов /

    Хотелось бы вот что уточнить.
    1) Для начала можно решить задачу двухклассовой классификации. Нужен набор сообщений с метками «правильное сообщение» (которое нужно оставить) и «неправильное сообщение» (которое подлежит удалению). Первая категория, очевидно, есть, а вторая? Сколько имеется тех и других сообщений в обучающей выборке? Соотношение классов в обучающей выборке соответствует таковому в реальном мире?
    2) Метрика «точность» является очень плохой мерой качества для такого рода моделей. Нужно решить, что важнее — отсеять весь спам ценой пропуска нормальных сообщений, или пропустить часть негодных сообщений, но сохранить все нормальные. То есть оптимизируется или чувствительность, или специфичность (или площадь по ROC-кривой, когда непонятно, что важнее).
    3) На каком языке писать нужно? Обученная нейросеть должна потом работать на каком-то сервере и отдавать ответ по запросу.
    4) И все же — почему именно нейросеть? Это модно и на слуху, или есть какие-то реальные причину? Можно ведь и логистическую регрессию рассматривать как частный случай нейросети с логистической функцией активации и одним нейроном…

    • Руслан Шекуров
      Руслан Шекуров /

      1) В обучающей выборке: правильных :33007 , неправильных : 1623 (но и в этой оценке возможно наличие % ошибок), соотношение скорее не соответствует реальному. Реальное и актуальные сообщения можно увидеть поделав запросы к API VK метода wall.search по словам «нужен донор», «нужна кровь» и подобные

      2) Важнее пропустить часть спама, но сохранить все нормальные сообщения

      3) Все верно, ответ по запросу к API на сервере, язык любой удобный разработчику

      4) Можно сделать и указанным образом, если точность определения будет расти с дальнейшим обучением и прочие условия соблюдены

Оставить комментарий
Предложили помощь
Присоединяйтесь к нам!
Вы заработали 10 очков опыта!