哈萨克斯坦研发出全球最大规模的突厥语语音识别人工智能模型
(哈萨克国际通讯社讯)哈萨克斯坦本土初创企业Cybernet AI近日推出全球规模最大的突厥语自动语音识别(ASR)模型,这是该领域迄今为止最重磅的区域性突破。
据数字发展和人工智能部消息称,该模型是中亚地区首个从零开始、完全针对突厥语族语言特点量身定制的大型人工智能系统,而非基于英语模型进行简单调整或微调,在技术路径上实现了根本性创新。
该项目在Astana Hub科技园及哈萨克斯坦数字发展和人工智能部战略支持下,利用微软提供的GPU基础设施完成开发。
Astana Hub执行董事塔纳特·乌斯肯巴耶夫表示:
“Cybernet AI的这项成果将使突厥语国家能够大规模、低成本、高质量地通过人工智能技术为企业和民众提供母语数字服务。对哈萨克斯坦而言,这意味着我们正从全球人工智能解决方案的单纯使用者,逐步转变为具备国际竞争力的技术输出国。”
该模型以哈萨克语、土耳其语、乌兹别克语、吉尔吉斯语、阿塞拜疆语和鞑靼语为基础进行训练,同时对商务及公共服务场景中广泛存在的突厥语-俄语混合口语表现出极高识别精度。
长期以来,哈萨克斯坦及中亚国家主要依赖国际主流ASR模型,这些模型以英语为中心,对突厥语的语音特点、口音变化及自然混杂表达支持不足,导致语音类人工智能服务质量长期受限。
Cybernet AI选择另辟蹊径,专门为本地区语言生态打造全新模型,充分融入当代突厥语的真实语言规律。
公司技术总监拉希德·伊斯梅洛夫强调:
“我们有意识地放弃了在英语模型上修修补补的路径,而是从头构建能够自然理解日常混杂口语的ASR系统。这一成果不仅是一款技术产品,更是为哈萨克斯坦人工智能本土生态建设和技术主权作出的重要贡献。”
新模型主要面向处理海量语音交互的行业,包括银行与金融机构、电信运营商、各层级呼叫中心、物流及服务企业,以及提供公共服务的政府部门。
开发团队认为,该模型能够显著降低客户服务渠道成本,并实现全天候高精度语音服务,在噪声环境、多种口音以及实时语言切换场景下均保持稳定表现,适用于从金融科技到政务服务的广泛领域。
作为Astana Hub成员企业,Cybernet AI专注于为银行、金融科技及其他受监管行业提供安全、可控的企业级人工智能解决方案。其平台在确保高性能、可扩展性和严格合规的前提下,大幅降低运营成本。
目前,Cybernet AI已在哈萨克斯坦、乌兹别克斯坦、吉尔吉斯斯坦、美国、墨西哥、埃及开展业务,并在英国及欧盟国家实施多个项目。公司解决方案支持包括哈萨克语、乌兹别克语、俄语、英语、阿拉伯语、西班牙语在内的34种语言。
值得一提的是,此前哈萨克斯坦已正式颁布人工智能相关立法,为该领域发展提供更加明确的制度保障。
【编译:木合塔尔·木拉提】