Freedom Broker

Реклама

  1. Главная
  2. Технологии
  3. Корпус казахского языка для KazLLM разрабатывают более 140 ученых

Корпус казахского языка для KazLLM разрабатывают более 140 ученых

Для языковой модели они собрали данные по 115 областям науки

Автор:
Kapital.kz
Kapital.kz

В министерстве науки и высшего образования рассказали, что разработана большая языковая модель KazLLM для развития искусственного интеллекта (ИИ) на казахском языке, сообщает корреспондент центра деловой информации Kapital.kz со ссылкой на пресс-службу ведомства.

Версия KazLLM с открытым исходным кодом доступна на платформе https://huggingface.co/issai.

«Модель можно использовать в некоммерческих научных и академических целях, при создании чат-ботов, виртуальных помощников, автоматических переводчиков по аналогии с Google Translate», - указали в Миннауки.

Для обеспечения корпуса казахского языка для KazLLM министерство привлекло специалистов Института информационных систем и искусственного интеллекта (ISSAI), научных институтов и высших учебных заведений.

В ведомстве считают, в условиях глобализации и стремления к сохранению культурной самобытности страны значимость проекта становится особенно актуальной и будет способствовать созданию эффективных решений для обработки, перевода и анализа текстовой информации на казахском языке, а также интеграции казахского языка в современные технологии.

Cвыше 140 ученых и сотрудников 26 ведущих научных институтов и вузов страны, принимавших участие в разработке корпуса казахского языка для KazLLM, занимались подготовкой больших объемов данных по экономике, финансам, математике, истории, биологии, химии, медицине, технологиям и другим 115 областям науки на казахском языке.

«Казахский национальный университет имени аль-Фараби осуществил подготовку данных по философии, этике, PR, астрономии, астрофизике и информационным технологиям. Институт математики и математического моделирования занимался составлением данных по направлениям математики. Институт истории и этнологии имени Ш. Уалиханова – контентом по истории, а медицинские университеты – данными в области медицины. Это сотрудничество способствовало созданию уникального контента на казахском языке, что обеспечит качественную и эффективную разработку модели», - сообщили в министерстве.

Напомним, 1 декабря 2024 года в Астане президенту Казахстана Касым-Жомарту Токаеву была представлена национальная языковая модель KazLLM. Модель была разработана под руководством Института умных систем и искусственного интеллекта (ISSAI NU) в партнерстве с Beeline Казахстан и его ИТ-компанией QazCode, а также Astana Hub. В конце года Касым-Жомарт Токаев посетил Международный центр искусственного интеллекта Alem.AI, который создается для трансформации Казахстана в ИИ-ориентированное государство. Главе государства была презентована концепция Центра искусственного интеллекта Alem.AI, который будет расположен в сфере Nur Alem.

Читайте также

При работе с материалами Центра деловой информации Kapital.kz разрешено использование лишь 30% текста с обязательной гиперссылкой на источник. При использовании полного материала необходимо разрешение редакции.

Вам может быть интересно

    Читайте Kapital.kz в

    TelegramInstagramFacebook
    telegramtelegram