|
杭州铸淘网络科技有限公司,电商代运营:揭秘阿里机器翻译团队:拿下5项全球冠军,每天帮商家翻译7.5亿次【二】摘要:他们要让商业没有语言障碍,打赢再造“通天塔”的“军备竞赛”。 难的不止是翻译 说到机器翻译,除了算法模型,大量的样本数据是非常重要的。这也恰恰是阿里的优势所在。 “举个例子,‘Photo Print’这个词在通用语境下会被翻成‘照片打印’,但你知道它在纺织面料行业里是什么意思吗?”李兮芝接着说,“这是‘热转印印花’工艺的一种,翻成照片打印就贻笑大方了。” 阿里本身沉淀了大量电商领域相关的数据,机器翻译团队进一步梳理出10亿级别的双语平行语料、亿级别的电商双语平行语料、千万级电商知识库,以及大规模行业多语言术语库。 然而,语言上的准确翻译只是第一道难关,更困难的是通过算法实现文化、法律、经济、宗教等层面的本地化落地。 一个案例让李兮芝印象深刻。“同样是10万,英美国家千位分隔符用逗号,标成‘100,000’;但法国、西班牙的千位分隔符是句号,逗号用来标小数点,10万在法国得标成‘100.000’,如果标成‘100,000’就表示是100了。”这类大额数字在阿里巴巴国际站经常出现,曾经出现过中国卖家因为没有将数字本地化,而被买家投诉的情况。 今年4月,主打男装的国内服饰品牌英爵伦,加入了阿里旗下的东南亚电商平台Lazada上的“淘宝精选”(Taobao Collection)计划。Lazada通过自动抓取天猫店的产品,帮助品牌拓展东南亚市场。“我们天猫店商品标题是全中文的,没想到Lazada能自动翻译成英文。”英爵伦跨境电商负责人刘晨芳说,“最重要的是,机器自动翻译的英文品牌名‘Enjeolon’,和我们真实的英文名分毫不差,太神奇了。” 刘晨芳不知道的是,Lazada这套自动翻译系统也是由阿里巴巴机器智能翻译团队开发出来的。翻译系统还改写了标题,让产品描述看上去更加接地气。 “淘系商品标题没有固定格式,由N个热搜词组成,但不是一个完整的句子。要是直接翻译,海外消费者压根看不懂。”李兮芝说,这种没有上下文信息的标题翻译,不论对人还是对机器,都是极大的挑战。“我们曾经找来专业人工译员翻译标题,结果译员翻到一半不干了,根本看不懂。” 后来,团队通过融合多种自然语言处理和文本生成技术,攻下了商品标题改写的难题。像英爵伦这样的中国品牌,不用担心Lazada上的东南亚买家会因为看不懂标题,而放弃购买商品。 今年5月,阿里巴巴正式上线对话实时翻译功能,这也是全球电商领域的首个实时翻译AI产品。“无障碍的跨语言沟通明显增加了阿里巴巴国际站的用户粘性。我们期望卖家不再需要为了做某一个国家的生意而专门聘请会那国语言的专职人员。”李兮芝说。除了用户体验的提高,阿里机器翻译还为旗下国际电商平台带来了明显的流量、转化率和购买率增长。 “机器翻译是块非常难啃的骨头。但如果我们真要实现全球买、全球卖,就必须要花精力去做。”李兮芝说。 铸淘电商旨在为中小企业主线上经营保驾护航! 网店代运营 天猫托管 淘宝托管 网店托管 1· 嘉兴天猫代运营 山东天猫代运营 淄博天猫代运营 临沂天猫代运营 江苏天猫代运营 常熟天猫代运营 广州天猫代运营 佛山天猫代运营。 -------------------------------------------------------------------------- 杭州铸淘网络科技有限公司【贯彻“小而美”理念,将精品进行到底】 联系人:沈经理【运营管理部】 Mobile:15869199884 0571-5850 4078 QQ: 315856572 微信:15869199884 Add: 浙江省杭州市西湖区文三路252号伟星大厦16楼 秉持深耕细作的运营宗旨、努力为商家打造电商旺铺。 成功对接唯品会、活动小2、站外团购、众筹、大淘客、微博等资源。 寻找优质商家长期深度合作,携手共赢! ---------------------------------------------------------------- 杭州天猫代运营:http://www.zhutao365.com/ 杭州铸淘代运营官网 : http://www.hzzhutao.com/ 杭州铸淘网络科技有限公司 : http://www.zhutaokj.com/zt/ |