从ChatGPT到国家大模型:哈萨克语加速迈向数字未来

(哈萨克国际通讯社讯)从社交媒体到电影产业,从在线媒体到人工智能系统,哈萨克语正加速融入数字世界,逐渐形成属于自己的全新传播空间。在人工智能技术迅猛发展的背景下,哈萨克语不仅迎来了数字化转型机遇,也面临着内容生态建设和语言传承的新课题。

цифрлық қазақ тілі
Фото: Kazinform / ЖИ

人工智能为哈萨克语注入新动力

近年来,人工智能成为推动语言数字化发展的重要引擎。OpenAI公司首席财务官萨拉·弗赖尔(Sarah Friar)表示,每周有超过9亿人使用ChatGPT,许多用户与人工智能的首次接触便始于这一平台。

根据哈萨克斯坦科学和高等教育部的数据,哈萨克斯坦已跻身人工智能应用水平较高的全球前30个国家。用户主要利用人工智能工具进行文本写作、信息检索以及各类实践任务处理。

专家预计,未来人工智能将实现对哈萨克语的流畅理解和应用。为此,哈萨克斯坦已开发出名为“Әлем LLM”的大型语言模型。该模型基于1480亿个词元数据训练而成,能够更好地理解哈萨克语的语言特点、文化语境和专业术语。

科学和高等教育部部长赛亚萨特·努尔别克(Саясат Нұрбек)表示,语言的未来与数字化进程密切相关,因此国内主要语言研究机构联合开发了首个国家级语言模型。

Қазақ тілінің цифрлық дәуірдегі болашағы қандай
Фото: Kazinform

数字化时代中的语言与国家认同

阿赫梅特·拜图尔孙吾勒语言学研究所(А. Байтұрсынұлы атындағы Тіл білімі институты)所长阿纳尔·法兹勒詹(Анар Фазылжан)指出,哈萨克斯坦语言学研究正积极顺应全球发展趋势。

近年来的重要成果之一,是基于20多个子语料库建立的哈萨克语国家语料库。该数据库借助大数据技术,为分析语言发展状况提供了重要基础。

她表示,研究机构正参与开发基于哈萨克语言文化特点的大型语言模型,并特别重视成语、谚语等传统语言资源的数字化整理。

与此同时,社会语言学、心理语言学和语言人格学等交叉学科也在不断发展。专家认为,语言直接影响人的思维方式和文化素养,因此儿童所处的语言环境以及接触的内容质量至关重要。

阿纳尔·法兹勒詹说,哈萨克语已经不仅是一种交流工具,更是数字化时代国家认同的重要组成部分。

儿童内容生态关系语言未来

儿童媒体消费习惯正在深刻影响语言的未来。国际数据显示,8岁以下儿童平均每天有2小时51分钟处于屏幕前。

目前,许多国家已将儿童内容视为塑造国家价值观的重要工具。美国、日本和中国等国家通过动画片和儿童节目,持续传播爱国主义、劳动精神和民族文化等价值理念。

Қазақ тілі
Фото: Kazinform

哈萨克斯坦近年来也在不断推进儿童内容建设。自2023年起,国家开始推动海外知名儿童频道的哈萨克语配音工作,Nickelodeon和TiJi频道的动画节目陆续推出哈萨克语版本。与此同时,Balapan儿童频道和哈萨克广播电台也持续增加儿童节目内容。2024年,已有20余部动画作品完成哈萨克语本土化并播出。

此外,Disney、Pixar和Sony等国际影视公司的影片也相继推出哈萨克语配音版本,进一步提升了优质内容在各地区的覆盖率。

不过,相关研究显示,哈萨克语数字内容建设仍存在短板。目前儿童数字内容中,俄语和英语内容依然占据主导地位,哈萨克语内容比例仍然偏低。

数据显示,在被分析的309个Instagram账号中,仅约30%的账号提供哈萨克语内容;TikTok平台上的比例则更低。虽然YouTube上的情况相对较好,但专门面向儿童且兼具心理安全性和教育性的优质内容仍显不足。

穆赫塔尔·阿乌埃佐夫文学与艺术研究所(М.Әуезов атындағы Әдебиет және өнер институты)首席研究员努尔博尔·库达伊别尔根诺夫(Нұрбол Құдайбергенов)指出,目前哈萨克斯坦近三分之一人口为儿童,18岁以下未成年人接近700万人。

他表示,出生于2012年之后的“阿尔法一代”成长于全新的数字环境之中。技术发展既带来机遇,也带来挑战,并直接影响儿童的心理、认知和生理发展。因此,增加高质量、富有内涵的哈萨克语儿童内容具有重要意义。

KazLLM мен AlemLLM
Фото: Kazinform

社交媒体成为哈萨克语传播新空间

如今,社交媒体已经成为推广哈萨克语和扩大其使用范围的重要平台。

在TikTok上,不少不同民族背景的创作者使用哈萨克语制作内容,展现出国家语言作为共同交流工具的凝聚力。

白俄罗斯裔演员塔季扬娜·图尔莱(Татьяна Турлай)便是其中的代表之一。她通过幽默短视频吸引了大量关注,并与朋友共同推出讽刺栏目《匿名俄罗斯人俱乐部》,以轻松形式分享在哈萨克斯坦的生活体验和文化适应经历。在个人账号中,她还经常介绍哈萨克传统习俗、婚礼文化以及民族间友谊等内容。

以“卡伊克巴耶夫”之名为人熟知的阿列克谢·洛多奇尼科夫(Алексей Лодочников)同样积极推广哈萨克语。他在儿童福利机构成长期间学习了哈萨克语和冬不拉演奏,其人生经历生动诠释了哈萨克语在拉近人与人距离、连接不同文化方面的重要作用。

哈萨克语和文学教师、博主阿勒特奈·乌捷根诺娃(Алтынай Өтегенова)也是活跃在社交平台上的推广者之一,她在TikTok上已拥有超过7万名粉丝。

她表示,自己的目标不仅是在哈萨克斯坦推广哈萨克语,更希望让世界看到这门语言的优美和丰富。经过对各种语言教学方式的比较,她发现社交媒体是当前最有效的传播工具。因此,她最初从词汇翻译、简短对话和日常用语入手,随后逐渐加入游戏元素,让语言学习变得更加生动有趣,并吸引越来越多的学习者。

KazLLM мен AlemLLM
Фото: Kazinform

哈萨克语正在开启新的发展阶段

除了线上传播,线下推广同样持续推进。以阿拉木图“勇敢开口”(«Батыл бол»)语言学习俱乐部为主题的纪录片项目,记录了学习者掌握哈萨克语的真实经历。

该片由电视编辑兼编剧塔季扬娜·希什金娜(Татьяна Шишкина)担任导演和编剧。影片通过记录导演本人以及其他学习者近一年半的学习历程,展现了人们克服心理障碍、改变认知并重新认识哈萨克语的过程。项目于2024年通过国家电影支持中心组织的项目路演,并获得专家委员会支持。

从国家语言模型建设到语料库研究,从儿童内容生态到社交媒体传播,再到语言学习纪录片的创作,一系列实践表明,哈萨克语已经进入新的发展阶段。随着国家政策、学术研究、数字平台和内容建设不断汇聚合力,哈萨克语在数字时代的传播空间和应用前景正不断拓展。