31选7开奖结果12089:失聪者的福音:人工智能读唇语 错误率减半

失聪者的福音:人工智能读唇语 错误率减半
2018年08月09日 10:47 新浪科技综合

思进门户资讯网,而法官员额制改革正是建立和完善司法人员分类管理制度的核心内容。张德江委员长出席。具体费用根据车型不同以到店核算为准。,悠悠地走进这里,踩在细碎不规则的鹅卵石路上,然后,沿着街道上的拱形土墙门拾阶而上……于是,大片大片蓝色开始映入眼帘,迷惘梦幻铺天盖地。 从传教士在明末清初时期,成功在中国立足、传教和最后传教失败的历史得出了“文化适应是相对完美的文化传播方式”的结论,这一方式对于我们从事文化保存和文化交流具有一定的参考价值。荣盛时代首府位于济南市历城区全福立交桥西北角,占地面积2万方,建筑面积万方。我们会一直支持我们的主帅,我们不会做决定,也不会因为可以通过卖票多赚一点钱而不守原则。”网友表示,开发商和政府人员多次承诺短期内办理,却一点进展都没有,希望政府能予以解决。天恒世界集总占...唯女可掇,唯小子衿可掇。 面对包裹“洪峰”,往年屡被“吐槽”的快递业准备得怎样?|公安部消防局局长于建华:消防安全需要全民参与11月9日,为我国消防日。”顾墨轩说。  30日下午,天珑广场招商大会的主会场天鹅湖大酒店洋溢着现代感元素十足的热闹场景。原标题:国家队出场150次,C罗里程碑之战献助攻北京时间6月8日凌晨,葡萄牙在一场热身赛中3-0完胜阿尔及利亚,C罗迎来国家队第150次出场,虽然没能打进标志性的进球,C罗还是用一记漂亮的助攻给自己的里程碑增色不少。项目主力产品致力从居住体验和感受出发,打造高赠送户型。,新车外观介绍:、双色球一等奖奖、地下车位配比1比机械式立体停车位满足商场的需求。,据施工方介绍,位于恩施土家族苗族自治州境内的宣鹤高速公路总长约55公里,于2015年年底开工建设。本季座谈会将聚焦2017年二季度出台的多项政策,对我国目前的经济形势进行解读与预判。齐备的商业配套:在项目周边3公里范围内云集了永辉超市、物美大卖场、万源广场、物美万源店、旧宫商厦、天上天购物广场、大中电器、必胜客...。

特别是对于这两款车而言,升车型已经不是它们全系车型的入门级车型,这样一来在配置上又有了进一步的保证。同样,萧山区政府板块,正逐步显现出各类优质资源吸纳与整合的发展趋势。 具体费用根据车型以到店核算为准。作为携手四位设计大师匠造的作品,梵悦108拥有与世界对语的艺术品味与生活方式,其空间创想与功能设计营造了身处CBD不失品位生活的高度融合体验。,哈尔滨胶纠科技有限公司合景映月台是由香港上市房企合景泰富集团,于北京海淀区建造规划的英伦风格城市别墅。械,桎梏也。张掖,取“张国臂掖,以通西域”之意。,4.卫生间和厨房作为重要的功能区间,尺寸合适,能够很好的满足主人生活需求。比亚迪e5其实就是比亚迪速锐的纯电动版车型,整体设计基本上与比亚迪速锐完全一致,但在一些细节方面进行了调整,如前格栅加入蓝色装饰条,前保险杠造型也更加稳重,车尾右侧加上了“e5”标识等,用以彰显其新能源车身份。由于不知什么原因,他无法使用高级攻击魔法(黑魔法),只能使用防御魔法(白魔法),为此他总是被大4岁的姐姐嘲笑,一气之下,便离家出走,想要在格兰雷亚大陆寻找解决办法。3艘消防船随后到场,经过3小时的灌救后,于21日下午4时许救熄。保和墨水湾项目位于汉阳区江堤中路,坐落于美丽的墨水湖畔(墨水湖东岸),项目总占地7万㎡,建筑面积约万㎡,其中普通商品房约万方(小高层、高层、别墅产品),项目容积率,建筑密度%,绿地率30%,规划户数...具体费用根据车型不同以到店核算为准。全明户型,每一个空间都带有窗户,保证后期居住时能够充分采光和透气;通透户型,保证空气能够流通起来,空气质量较好;采光较好,保证居住舒适度。大家归隐,浓荫掩映家门润泽御府与润泽公园居住区周边有48万平米市政绿地,草木葳蕤,浓荫葱郁,渐渐生长成幽静绵长的绿色走廊,其中有17万平米市政绿地与润泽御府墅区北部为邻,广阔的公共活动空间,向墅区业主表达着“拥抱自然”的召唤。,这是中国第一座以“城市学”命名的特色图书馆,以“城市与城市学”为馆藏特色,馆藏图书文献近13万册。 ,5月29日,原中共浙江省委常委、杭州市委书记,浙江省人民政府咨询委员会副主任,杭州城市学研究理事会理事长王国平会见原国家建设部部长,第十一届全国人大环资委主任汪光焘一行。具体费用根据车型不同以到店核算为准。。

  来源:中国科学报

  对于数百万失聪者来说,唇读可以提供一个与外界交流的窗口。但这种做法很难,结果也往往不准确。

  现在,研究人员编写了一种新的人工智能(AI)程序,其性能优于专业的唇读者和迄今为止最好的AI,且错误率仅为之前最佳算法的一半。如果被完善并集成到智能设备中,这种方法可以让每个人都能懂唇读。

  “这是一项了不起的工作。”未参与该研究的英国伦敦玛丽皇后大学计算机科学家Helen Bear说。

  编写可以阅读唇语的计算机代码令人抓狂。

  因此,在新研究中,科学家向机器学习“求助”,让计算机从数据中学习。

  他们为该系统提供了数千小时的视频和抄写本,并让计算机自己解决这个问题。

  该项目始于14万小时的YouTube视频,视频展示了人们在各种情况下进行的交谈。

  然后,研究人员设计了一个程序,通过每个音素或单词声音的嘴部动作创建几秒钟的剪辑,并带有标注。

  该程序过滤掉了非英语语音、非讲话者面孔、低质量视频和未直接拍摄的视频。然后,他们裁剪了讲话者嘴巴周围的视频。

  这样产生了近4000个小时的录像,包括超过12.7万个英文单词。

  没有参与该研究的美国哥伦比亚大学计算机科学家Hassan Akbari说,这个过程和由此产生的数据集比同类数据集大7倍,对于任何想要训练类似系统阅读嘴唇的人来说都是“重要且有价值的”。

  此外,该过程部分依赖于神经网络。

  AI算法包含许多连接在一起的简单计算元素,这些元素以类似人脑的方式学习和处理信息。

  当研究人员为该系统提供未标记的视频时,这些网络会裁剪嘴巴动作片段。系统中的下一个程序也使用了神经网络,为每个视频帧提供了可能的音素列表及其概率。最后一组算法将可能的音素序列进行整理,并生成了英语单词序列。

  经过训练,研究人员用它之前没有看过的37分钟的视频测试了该系统。

  他们在发布于arXiv网站的论文中报告说,单词错误率仅为41%。

  这个成绩可能听起来并不怎么样,但之前最好的算法——专注于单个字母而不是音素——的错误率为77%。

  在同一项研究中,专业唇读者的错误率为93%(尽管在现实生活中他们能参考语境和肢体语言,这有助于读唇)。

  这项工作由总部位于伦敦的人工智能公司DeepMind完成,但该公司拒绝就这一记录发表评论。

  Bear表示,该程序对音素的理解可能看起来不同,具体取决于之前和之后所说的内容。(例如,在说“boot”中的“t”时,嘴的形状与说“beet”中的“t”不同。)

  系统有单独的阶段预测嘴唇形状代表的音素和通过因素预测单词。这意味着如果想教系统识别新的单词,你需要重新训练最后一个阶段。

  但她说,这个AI也有弱点:它需要清晰、直白的视频,41%的错误率远非完美。

  Akbarni表示,将程序整合到一部手机中可以让听力障碍人士随身携带“翻译”。

  这样的翻译也可以帮助那些不能说话的人,例如声带受损者。对于其他人来说,它可以简单地帮助解析各种聊天。

  这种技术也可应用于其他程序,例如分析安全视频、解释历史镜头,或在音频下降时听到Skype伙伴的语音。

  新的AI方法甚至可以回答世界上最大的一个谜团:在2002年世界杯决赛中,法国足球运动员齐达内因用头部顶撞对手而被红牌罚下。

  他显然是被对手的脏话所激怒,但他说了什么?

  我们也许可以揭开谜底了。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

科学大家

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片