Я получил массу удовольствия, работая над этим небольшим проектом, в котором задействованы nlp, самый классический алгоритм кластеризации (k-means) и немного глубокого обучения.
Все началось с мысли: а что если… мы могли бы сделать Х. Как бы мы это сделали? Что для этого нужно? «Сделать это» потребовало много исследований и обучения с моей стороны, как в области НЛП, так и в том, как поставлять такие большие модели в производство и заставить их работать достаточно быстро.
О некоторых из этих опытов я уже писал, но эта новая статья, только что опубликованная сегодня, объясняет более высокоуровневый взгляд на то, что и как было сделано.
https://kahoot.com/tech-blog/text-clustering-using-deep-learning-language-models/