![汉华优配](/images/logo.png)
中新社西宁5月25日电 (记者孙睿)记者25日从青海师范大学省部共建藏语智能信息搞定及应用国度重心施行室获悉,该施行室已初步建成600TF算力的智算平台和面向多领域多用途的大范畴藏语数据资源库。
青海师范大学省部共建藏语智能信息搞定及应用国度重心施行室2021年2月事中国科技部批准竖立,是中国惟一的藏语信息搞定领域国度重心施行室。施行室领有5000当年米的科研用房和1.5亿元东谈主民币的专科研发开导。
该施行室主任赵海兴先容,连年来,施行室构建了藏文百科学问、新闻、经济、文化艺术等多领域文本语料40G以上,藏语语音数据15000小时、各类文化资源近2万件,范畴达到1600GB,是当今国表里最大的基于国处所大型标注语料库,对中国涉藏地区解说、说话运筹帷幄以及社会文化发展起到积极鞭策作用。
同期,该施行室还构建了大范畴藏汉平行语料库,配资门户并通过迭代式回译战略等进行数据增强及质地评价,考验了会通单语说话模子和注入双语辞书信息的深度神经收罗翻译模子,在新闻、法律等领域准确率达90%以上。
此外,该施行室还搭建藏文文件资源数字化协同职责平台,构建文件图文对照数据150余万文本行,复杂场景图文资源220万个,开展藏文印刷字体、复杂场景藏文区域检测运筹帷幄,自动检测视频帧中的翰墨区域,并将其分割成单个字符或行文本。哄骗深度学习对分割搞定后的文本进行识别,已毕了藏文文件治安体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别。(完)
Powered by 汉华优配 @2013-2022 RSS地图 HTML地图
建站@kebiseo; 2013-2024 万生优配app下载官网 版权所有