Так, нейросеть будет автоматически определять материалы, в которых содержатся враждебные высказывания и публикации, провоцирующие пользователей проявлять агрессию:
Нейросеть учится определять самые разные категории оскорблений и угроз. Среди них: проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.— уточнили представители.
Для того, чтобы усилить модерацию, связанную с языком ненависти, и обучить нейросеть, разработчики «ВКонтакте» добавили новую категорию жалоб — «Враждебные высказывания». С ее помощью можно будет улучшить уже существующие инструменты, а также собрать данные для реализации новых решений.
Как утверждают модераторы, только за первую половину 2020 года были удалены более 520 тысяч единиц контента, вызывающего вражду и ненависть. «ВКонтакте» заблокировала более тысячи профилей и почти 2500 сообществ, которые распространяли враждебные высказывания.