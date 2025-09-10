叶尔博勒·阿布萨拉莫夫介绍，去年该研究所开发出首个国家级大语言模型KazLLM，功能类似于ChatGPT。用户输入文本后，模型能够以文本形式回应，支持问答、翻译等功能。为此，团队收集了1500亿个语言单元（即“token”，每个token大致相当于一个单词），相当于约150万本书的体量，涵盖了哈萨克语的所有可用数据，包括从网络上获取的全部公开信息。

如果人工逐一浏览网站、提取句子并整理这些数据，可能需要耗费10年时间。而团队仅通过编写代码，自动抓取所有KZ域名网站的数据并存入数据库，极大地提高了效率。

他进一步指出，将这些数据输入人工智能模型并让其理解，仅用了两周时间。

“试想，阅读、理解并分析150万本书需要多少时间？一个人可能需要5到10辈子。而去年我们获得了试用超级计算机资源的机会。这种计算机配备GPU显卡和芯片，能够每秒执行数十亿次并行运算。其计算能力以‘每秒千万亿次浮点运算’（petaflop）为单位，意味着每秒可进行10^15次运算。以哈萨克斯坦2000万人口为例，如果每月给每个人布置数学、化学、逻辑或物理任务，成年人可能需要2到3分钟解决，老人可能耗费10到15分钟，而儿童可能完全无法完成。然而，超级计算机能在几秒钟内完成相当于2000万人共同完成的任务。这就是它的强大之处——能够以极快的速度处理海量数据。150万本书的内容，它在两周内就能读完、学习并记忆。随着计算能力的提升，其处理速度还会进一步加快。”

叶尔博勒·阿布萨拉莫夫还提到，哈萨克斯坦从2019年开始引入超级计算机，目前已拥有第三代超级计算机。近期，哈萨克斯坦电信公司与相关部门合作，成功引入了第五代超级计算机，为科研和产业应用提供了更强大的支持。

通过超级计算机的强大算力，哈萨克斯坦在人工智能和大数据处理领域迈出了坚实步伐，为未来的科技发展和生活便捷化奠定了基础。

【编译：木合塔尔·木拉提】