KazLLM与AlemLLM:哈萨克斯坦推进国家语言模型建设与技术主权路径

Photo: Фото: Kazinform

(哈萨克国际通讯社讯)在将2026年定为“人工智能之年”的背景下,哈萨克斯坦正以“技术主权”为目标,加快推进本国大型语言模型(LLM)的研发与应用。KazLLM与新一代AlemLLM项目,成为我国在人工智能领域的重要探索方向。

政策背景与社会关注

今年2月举行的政府会议上,哈斯穆-卓玛尔特·托卡耶夫总统指出,当前社会对国产KazLLM项目的信任度仍有待提升。这一表态引发舆论对项目进展、应用效果及投入情况的广泛关注。

同一会议上,人工智能和数字发展部部长扎苏兰·马迪耶夫表示,KazLLM及AlemLLM已被应用于40多个系统中。

针对公众关注的使用规模与资金投入问题,有关部门在回应媒体询问时表示,项目具体资金规模及来源属于内部信息,暂不对外公开。

Фото: Kazinform

LLM概念与国际发展趋势

根据主管部门解释,LLM即“大型语言模型”,是构建各类人工智能应用的基础平台。以ChatGPT为代表的产品,正是基于此类模型开发的应用层工具。

专家指出,当前阿联酋、沙特阿拉伯、中国、俄罗斯等国家均在加快开发本国语言模型,以实现技术自主与数据安全。

“这一领域属于高投入、高迭代的战略方向,全球领先企业通常投入数亿美元,并每年进行多次模型更新。”相关说明中指出。

Фото: Kazinform

KazLLM的研发与应用情况

KazLLM最初由纳扎尔巴耶夫大学智能系统与人工智能研究所(ISSAI)自主研发,并于2024年12月13日发布首个版本。

该模型推出了80亿与700亿参数两个版本,在学术与科研领域已处理超过13.8万次请求。

目前,ISSAI已将KazLLM的相关权利移交至阿斯塔纳枢纽(Astana Hub),但关于当前实际用户规模,尚无公开统计数据。

从KazLLM到AlemLLM的升级

随着技术路线调整,我国正将研发重点转向新一代AlemLLM模型。该模型在语言能力上进一步优化,支持哈萨克语、俄语及混合语言环境,提升本地化适应能力。

据介绍,目前基于AlemLLM已开发42项人工智能应用,涵盖政府服务、商业领域及公共服务等方向,包括:

  • Qazaq Law数字法律顾问;

  • 为海外哈萨克斯坦公民提供支持的领事服务助手;

  • 政府采购与税务咨询系统;

  • AI eGov等数字政务解决方案。

Фото: Kazinform

技术安全与数据主权

AlemLLM运行在国家超级计算机平台上,并部署于隔离网络环境中,不直接连接互联网。

这一架构设计旨在确保数据在境内处理与存储,符合国家数字安全与信息主权要求。

此外,该模型已在国际人工智能平台Hugging Face上发布,体现出一定程度的开放性。

投资与发展前景

尽管有关部门未披露具体投资规模,但业内普遍认为,建设国家级语言模型属于长期战略性投入。

分析人士指出,随着人工智能技术加速发展,语言模型将成为数字经济的重要基础设施,其价值不仅体现在商业应用,也关系到国家技术独立性与信息安全。

结语

从KazLLM到AlemLLM,哈萨克斯坦正逐步构建本国人工智能基础能力体系。在技术主权理念引领下,相关项目虽仍面临公众认知与应用推广等挑战,但其战略意义已日益凸显。

【编译:木合塔尔·木拉提】