超级计算机:几秒钟完成2000万人才能完成的工作

( 哈萨克国际通讯社讯 )超级计算机如何让我们的生活更便捷?在以“总统国情咨文:哈萨克斯坦未来发展方向”为主题的会议上,纳扎尔巴耶夫大学智能系统与人工智能研究所执行主任叶尔博勒·阿布萨拉莫夫对此问题进行了深入解答。

Фото: Kazinform

叶尔博勒·阿布萨拉莫夫介绍,去年该研究所开发出首个国家级大语言模型KazLLM,功能类似于ChatGPT。用户输入文本后,模型能够以文本形式回应,支持问答、翻译等功能。为此,团队收集了1500亿个语言单元(即“token”,每个token大致相当于一个单词),相当于约150万本书的体量,涵盖了哈萨克语的所有可用数据,包括从网络上获取的全部公开信息。

如果人工逐一浏览网站、提取句子并整理这些数据,可能需要耗费10年时间。而团队仅通过编写代码,自动抓取所有KZ域名网站的数据并存入数据库,极大地提高了效率。

他进一步指出,将这些数据输入人工智能模型并让其理解,仅用了两周时间。

“试想,阅读、理解并分析150万本书需要多少时间?一个人可能需要5到10辈子。而去年我们获得了试用超级计算机资源的机会。这种计算机配备GPU显卡和芯片,能够每秒执行数十亿次并行运算。其计算能力以‘每秒千万亿次浮点运算’(petaflop)为单位,意味着每秒可进行10^15次运算。以哈萨克斯坦2000万人口为例,如果每月给每个人布置数学、化学、逻辑或物理任务,成年人可能需要2到3分钟解决,老人可能耗费10到15分钟,而儿童可能完全无法完成。然而,超级计算机能在几秒钟内完成相当于2000万人共同完成的任务。这就是它的强大之处——能够以极快的速度处理海量数据。150万本书的内容,它在两周内就能读完、学习并记忆。随着计算能力的提升,其处理速度还会进一步加快。”

叶尔博勒·阿布萨拉莫夫还提到,哈萨克斯坦从2019年开始引入超级计算机,目前已拥有第三代超级计算机。近期,哈萨克斯坦电信公司与相关部门合作,成功引入了第五代超级计算机,为科研和产业应用提供了更强大的支持。

通过超级计算机的强大算力,哈萨克斯坦在人工智能和大数据处理领域迈出了坚实步伐,为未来的科技发展和生活便捷化奠定了基础。

【编译:木合塔尔·木拉提】