产品中心

当前位置: 首页 > 产品中心 > 钢丝螺套

高水平开展我来说丨语料“螺丝钉”铆紧东盟链

时间: 2025-08-09 作者: 钢丝螺套
产品详情

  8月6日,南宁市西乡塘区和德科创中心内,广西达译科技有限公司(简称达译科技)的言语工程师们正在电脑前繁忙。界面上,越南语、柬埔寨语、泰语等东南亚国家的言语热词、热句不断翻滚,经实时清洗、标示后,汇入公司15亿句对的中文—东盟言语精加工语料库。

  “每一条新入库的语料,都是未来翻译引擎里的一颗‘螺丝钉’。”达译科技总经理温家凯的话语里,藏着企业与东盟语料库建造的同频共振。

  温家凯仍是广西翻译协会副会长。他带领的达译科技自2009年景立起,就锚定东南亚言语处理技能范畴。创业初期,团队从越南语、泰语下手测验。“这是东南亚言语里语料相对多的两种言语,但其时只能靠纯人工拆分对齐,要投入很多人力逐字比对,耗时长,稍不留神还会因语序差异或语义含糊呈现讹夺。”温家凯回想。

  技能打破的种子由此埋下,言语工程团队提出了技能优化想象。温家凯介绍:“从2012年开端,咱们继续探究与研制,根据需求迭代了五、六十种自动化处理程序,完成了华章的精准对齐和智能断句拆句。”

  而数据稀缺、言语资源涣散、技能适配性差等职业共性难题接二连三。为此,团队自主研制跨言语预练习模型,构建半自动化数据标示系统,令数据质量和处理功率大幅提高。

  2024面向东盟人工智能协作会议上,达译科技完成了英语、越南语、泰语、印尼语、马来语、缅甸语、老挝语和柬埔寨语的AI实时翻译投屏显现,赢得现场嘉宾的共同好评。“在杂乱环境下,咱们的AI实时翻译投屏准确率能到达85%,抱负环境下可以到达95%以上。”温家凯的口气里有掩不住的骄傲。

  今年以来,《广西“人工智能+制作”举动计划(2025—2027年)》等文件密布出台,助推人工智能技能在各范畴场景大范围的使用。广西活跃构建“北上广研制+广西集成+东盟使用”的AI开展途径,把东盟语料库建造作为打造我国—东盟人工智能协作高地的一号根底工程快速推进,加强与东盟国家对接交流。

  现在,达译科技的初级语料库数据量达百亿级,产品服务已超200家国内企业,但在拓宽东盟商场时仍面对应战。温家凯坦言:“言语文化差异、技能标准不一致等问题仍阻止着两边的大规模协作。”

  而正炽热进行的AI赋能千行百业超级联赛为破局带来了新关键。“这场聚集人工智能、经济转型、东盟协作的赛事,会让AI大模型和东盟语料库建造磕碰出新的火花,也为咱们发掘和培育人工智能人才供给了渠道。”温家凯说。

  从人工敲打到智能迭代,达译科技的15年探究,见证着广西以“言语+数字”途径打通我国—东盟协作头绪的决计。在协作的热土上,更多“螺丝钉”正不断嵌入区域协同的齿轮,让人工智能成为衔接我国与东盟的桥梁,推进两边协作迈向更深层次。

上一篇: 螺钉题材名单看这里!(202587)

下一篇: 耐极塑胶五金请求用于螺丝制作设备的螺丝检测设备专利可完成对进行细心的检测并对不合格品符号计数