Самарский государственный медицинский университет и компания «МТС» на базе лаборатории по искусственному интеллекту приступили к формированию базы медицинских данных с помощью студентов самарского вуза. В дальнейшем она будет использоваться для распознавания и обработки медицинской речи, как пациентов, так и врачей.
Как сообщили в университете, в задачи студентов входит разметка данных различных симптомов. В процессе разметки происходит качественное преобразование: сырые данные превращаются в набор структурированных данных. Эта работа требует понимания медицинских терминов и их применения в контексте взаимодействия врача и пациента, поэтому к ней привлекли учащихся третьего курса и старше. Данные — это топливо для искусственного интеллекта, и чем больше данных обработает алгоритм, тем более точно и корректно он сможет формулировать выводы на их основе. Медицина — сфера, в которой важна точность, в этой области накоплен большой объем неструктурированных данных, но для использования в системах машинного обучения их необходимо структурировать и разметить.
«Как это происходит: например, есть несколько предложений, в которых фигурирует “боль”. Ребята должны разметить эти данные в формате “что болит, какая область болит, какой симптом” и так далее– таким образом, мы учим систему с использованием искусственного интеллекта правильно определять локализацию дискомфорта, его характер – болевой синдром, набор симптомов. По сути, мы размечаем эти данные, чтобы в перспективе на их основании система могла самообучаться и анализировать текст без привлечения человека»,
– пояснил руководитель отдела проектного менеджмента Института инновационного развития СамГМУ Петр Кшнякин,