Ученые Массачусетского технологического института (МТИ) разработали алгоритм, который назвали DeepMoji, который умеет распознавать сарказм и эмоциональный подтекст лучше, чем большинство людей.
Сначала ученые работали над системой, которая была бы способна распознавать расистки посты в Twitter. Затем, они поняли, что некоторые твиты и их значение невозможно правильно понять без распознавания сарказма.
Для нейросети используют технологию глубокого обучения, когда сеть учат распознавать небольшие паттерны в большом количестве метаданных. Многие твитты содержат смайли и эмодзи, и когда ученые воспользовались этим для обучения системы, ей стало проще воспринимать сарказм, так как она нашла связь между стилем речи и использованными смайлами.
Для тренировки DeepMoji было собрано 55 млрд твитов и отобрано 1200000000 из них, где содержались 64 популярные комбинации эмодзи. Ученые смогли найти способ обучить систему с помощью смайлов, учитывая то, какой из них будет использоваться при том или ином типе общения и распределили его по настроению — грустное, радостное и т.д. А затем уже приступили к обучению сарказма.
Испытания алгоритма прошли успешно и ученые сообщают, что он работает лучше своих предшественников.