GigaChat Сбера научили понимать и создавать тексты на более чем 30 языках народов России и стран СНГ, сообщает пресс-служба банка.
Теперь GigaChat понимает татарский, чувашский, якутский, осетинский и другие языки.
Для улучшения понимания каждого языка была проведена отдельная точечная доработка модели.
Со сбором данных для обучения GigaChat Сберу помогли ФГБУ «Дом народов России», интернет-энциклопедия «Рувики», региональные академии наук, научные и образовательные организации, а также некоммерческие фонды.
Обучающий набор по каждому языку для обучения включал в себя от сотен тысяч до нескольких миллионов документов, собранных в библиотеках, университетах, медиа и культурных институтах. Также команда Сбера оптимизировала алгоритмы обработки национальных языков, чтобы улучшить эффективность обучения.
По словам старшего вице-президента, руководителя блока «Развитие генеративного ИИ» Сбера Антона Фролова, GigaChat хотят сделать по-настоящему массовым продуктом.
«В России используют более 270 языков и диалектов, и мы ставим перед собой задачу, чтобы как можно больше жителей могли общаться с нашим ИИ-помощником на родном языке», — сказал он.