Программирование [Архэ] [Александр Пиперски] Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024)

Moderator
29 Мар 2020
286,632
1,306,089
113
Голосов: 0
#1
[Архэ] [Александр Пиперски] Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024)


Описание [Архэ] [Александр Пиперски] Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024):



Компьютерная лингвистика — это активно развивающаяся область, находящаяся на стыке теории и практики. Мы сталкиваемся с результатами её работы каждый день: это и машинный перевод, и поиск в интернете, и голосовые помощники, и многое другое. За всеми этими продуктами стоит кропотливая работа лингвистов и программистов.

В ходе курса мы рассмотрим историю компьютерной лингвистики и наиболее популярные методы, а также увидим, как они помогают решать практические задачи, такие как проверка орфографии или классификация новостей по темам.

7. Классификация, кластеризация и оценка сходства текстов

Одна из важных задач компьютерной лингвистики — группировка похожих текстов. Это может быть как разделение на заранее определённые категории («Спорт», «Политика» и т. д.), так и разделение на основе сходства самих текстов. Например, новостные агрегаторы сначала объединяют похожие тексты в один сюжет, а затем присваивают ему определённую категорию.

На занятии мы обсудим, как можно измерять расстояние между текстами, чем отличается задача классификации от задачи кластеризации и как эти задачи решаются.

Лектор: Александр Чедович Пиперски, кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ.

Подробнее:


Для просмотра содержимого вам необходимо авторизоваться

Скачать курс [Архэ] [Александр Пиперски] Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024):


Для просмотра содержимого вам необходимо авторизоваться
 
Последнее редактирование модератором: