为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

百度世界绘声绘色

2012-11-18 41页 pdf 14MB 13阅读

用户头像

is_349501

暂无简介

举报
百度世界绘声绘色 绘声绘色 百度语音和图像技术 余凯 百度多媒体部 报告提纲 n  百度为何发力多媒体技术 n  百度语音技术的发展现状,优势,和展望 n  百度图像技术的发展现状,优势,和展望 0.百度为何发力多媒体技术 百度的使命 让人们最平等便捷地获取信息,找到所求 中国互联网三大机会 2011年4月12日,百度CEO李彦宏在百度联盟峰会上发表 演讲称,中国互联网未来两到三年应该有的三大机会, 分别是:中间业务、读图时代、和应用为王 百度希望学术界解决的9...
百度世界绘声绘色
绘声绘色 百度语音和图像技术 余凯 百度多媒体部 提纲 n  百度为何发力多媒体技术 n  百度语音技术的发展现状,优势,和展望 n  百度图像技术的发展现状,优势,和展望 0.百度为何发力多媒体技术 百度的使命 让人们最平等便捷地获取信息,找到所求 中国互联网三大机会 2011年4月12日,百度CEO李彦宏在百度联盟峰会上发表 演讲称,中国互联网未来两到三年应该有的三大机会, 分别是:中间业务、读图时代、和应用为王 百度希望学术界解决的9个难题 2012年8月13日,百度CEO李彦宏在国际数据挖掘会议ACM KDD上发 表演讲,提出9个希望学术界帮助解决的技术难题,其中前三项是: 1. 自然图片OCR 2. 语音识别和理解 3. 图像搜索 业界现状和趋势:读图时代 - 全民低成本造图 - 图片的社会化分享 业界现状和趋势:语音交互 语音交互成为兵家必争的移动互联网的重要入口之一 苹果 Nuance Google 科大讯飞 百度多媒体部 绘声绘色,亦框亦云 百度多媒体团队 精英和充满 活力的团队 丰富的产 品和开放 的平台 世界级的 研发实力 1.百度语音技术 百度语音技术优势 领先的中文自然语言处理技术 语音处理和机器学习算法积累 海量数据处理和并行建模技术 强大的互联网资源整合利用能力 1. 用户个性化的声音建模技术和海量数据的区分度训练技术 - 支持数以亿计的用户账户个性化声音建模 - 支持数千小时的声学训练数据的大规模并行区分度训练 2. 海量语言模型的高速构建和更新技术 - 支持数百G语料的统计语言模型小时级别的单机高速训练 - 能够在半个小时内更新数十G语言模型所形成的解码空间 3. 支持复杂汉语语义空间的一遍解码技术 - 支持几十亿文法的语言模型的一遍解码 - 支持包含语义信息的语法模型和普通统计语言模型混合解码 - 能够支持数百万量级词典的复杂语义空间建模 - 精度和速度统一的解码算法 百度语音核心技术 语音搜索识别准确率 语音搜索2G网络响应时间 世界领先中文语音搜索识别准确率 统一接入接口 解码器 搜索领域 模型 地图领域 模型 应用领域 模型 。。。 掌上百度 百度搜索 手机地图 百度应用 Ting! 手机浏览器 百度通讯录 百度app 解码器 解码器 解码器 。。。 音乐领域 模型 一套架构,多样化产品 百度搜索客户端-语音搜索 n  中国唯一完全自主开 发的语音搜索产品 n  世界最好的中文语 音搜索识别率 http://shouji.baidu.com/baidusearch/ 地图语音搜索 http://shouji.baidu.com/map/ 移动语音输入法 n  中国互联网企业唯一自主开发的语音输入法产品 n  是继科大讯飞后,市场上第二个语音输入法产品 n  识别率大大超过苹果Siri n  获得用户广泛好评 http://shouji.baidu.com/input/ 短信输入 微博输入 古诗输入 新闻输入 适合多种应用的高精度语音输入 http://shouji.baidu.com/input/ 百度手机浏览器 http://shouji.baidu.com/browser/ 百度语音技术展望 n  更精准的语音语义理解 - 识别不是目的 n  统一的语音交互入口 - 超越语音输入法 n  跨领域资源与服务整合 - 百度框计算 n  向开发者开放的语音平台 - 百度云平台 2.百度图像技术 百度图像技术优势 互联网上海量图像数据抓取 中国最大的图像搜索引擎和海量用户点击 海量数据处理,计算机视觉,和机器学习技术 丰富的产品线带来的图像技术需求和效果验证方法 百度图像技术方向 n  图像搜索:以文搜图 -> 以图搜图 -> 以图搜信息 … 百度图像技术方向 n  图像搜索:以文搜图 -> 以图搜图 -> 以图搜信息 … n  图像理解:OCR, 图像标注,人脸识别,黄色图片检测 … 百度图像技术方向 n  图像搜索:以文搜图 -> 以图搜图 -> 以图搜信息 … n  图像理解:OCR, 图像标注,人脸识别,黄色图片检测 … n  图像质量和编辑:质量判断,质量提升,图像美化 … 自然图片OCR 印刷文本扫描图像 微软 doc 文件 传统的OCR问题 百度面临的OCR问题 自然图片OCR 识别和理解图像中丰富的文字,应用于百度各产品线: -  提升多媒体搜索的用户体验 -  检测互联网上不良欺诈行为 印刷文本扫描图像 微软 doc 文件 传统的OCR问题 百度面临的OCR问题 检索图片 百度开发的视觉搜索技术 Google搜索结果 检索图片 百度开发的视觉搜索技术 百度技术 Google搜索结果 检索图片 百度开发的视觉搜索技术 百度开发的视觉搜索技术 百度技术 Google搜索结果 检索图片 百度技术 Google搜索结果 检索图片 百度开发的视觉搜索技术 检索图片 返回相似图片,相似度排序由高到低 百度人脸识别和检索技术 4百万互联网随机人脸库 非限制条件下,不同的光线, 朝向,表情,背景,… 返回结果前五命中率>95% 优于世界最好技术face.com 4百万互联网随机人脸库 非限制条件下,不同的光线, 朝向,表情,背景,… 返回结果前五命中率>95% 优于世界最好技术face.com 返回相似图片,相似度排序由高到低 检索图片 百度人脸识别和检索技术 百度魔图 http://motu.baidu.com/ 百度搜索客户端-图像搜索功能 http://shouji.baidu.com/baidusearch/ 百度相册 http://xiangce.baidu.com 百度图像技术展望 n  打破像素到语义的鸿沟 - 更精准的图像内容理解 n  带来用户体验的提升 - 更优异的图像质量和搜索相关性 n  服务于更多核心产品 –移动和云战略,图像内容变现 n  构建共赢的生态系统 - 向开发者开放的图像技术云平台 谢谢各位 Q&A
/
本文档为【百度世界绘声绘色】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索