为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 如何利用google帮助翻译

如何利用google帮助翻译

2011-11-23 17页 doc 205KB 35阅读

用户头像

is_743385

暂无简介

举报
如何利用google帮助翻译转帖:如何利用google帮助翻译~~~ 因特网辅助翻译(IAT)技巧浅议 ——本文件由“摇摆桥”收集整理 奚德通:中国译典总编辑 身为因特网时代的翻译员,我们有没有充分利用信息革命给我们带来的巨大便利呢? 就本人来讲,在搞笔译时是须臾离不开电脑和网络的,我最常用的二件工具是中国译典和GOOGLE,其它词典基本上不用。如果某个东西能在海量的中国译典中查到,那自然省事,照搬就是;如若没有,只好到GOOGLE中去大海捞针,“海”大了什么“针”都有,就看你会捞不会捞! Google以快速全面的全文搜索为其特征,能在数秒钟内从...
如何利用google帮助翻译
转帖:如何利用google帮助翻译~~~ 因特网辅助翻译(IAT)技巧浅议 ——本文件由“摇摆桥”收集整理 奚德通:中国译典总编辑 身为因特网时代的翻译员,我们有没有充分利用信息革命给我们带来的巨大便利呢? 就本人来讲,在搞笔译时是须臾离不开电脑和网络的,我最常用的二件工具是中国译典和GOOGLE,其它词典基本上不用。如果某个东西能在海量的中国译典中查到,那自然省事,照搬就是;如若没有,只好到GOOGLE中去大海捞针,“海”大了什么“针”都有,就看你会捞不会捞! Google以快速全面的全文搜索为其特征,能在数秒钟内从近一百亿个网页中找到包含你输入的关键词的结果;只要你输入合适的关键词,查到适当的,许多在翻译上遇到的问题都可迎刃而解。 几乎没有一个翻译员是不用词典的,而Google就是我们所能找到的最庞大的词典——确切地说,这样一本词典其实就是整个互联网,而Google的作用是使得这本浩如烟海的虚拟大词典变得可利用,可查询。 笔者将自己在这几年内利用google的一些实例和体会作了一番总结,略举于此,希望能对后来者有所益助。 Google的第一个用途是可以帮我们破译疑难英文单词,特别是那些在传统词典中查不到的。互联网中既有在数量上占绝对优势的英文网页,也有着无以计数的纯中文网页,但对翻译人员来说最有价值的是那些中英文杂合的双语网页,这些双语网页以各种形式存在,诸如分类词汇、翻译研讨、双语应用文、双语企业站点、双语新闻等等,这其中有好多是以明显的中英文对照呈现在我们面前的,给我们迅速查找对应译文带来了极大的便利。 但是如何才能查到这些双语网页呢?这里面大有讲究。比如你想查一个机械术语“无级调速”的译法,在google查询框中直接输入“无级调速”得到的结果都是中文,解决不了问题。但你可以用“引诱法”,即用一个“诱导词”引出有中英文对照的网页,这个“诱导词”一般应该是目标语词,而且应该是和查询词直接相关的,比如上例,要查“无级调速”的英译,那么诱导词应该是个英语单词,根据我们的经验,这个词的英译中应该带个“速度”,故输入“无级调速, speed” ,嘿,一大堆带有“无级调速”和它的多种对应英译“stepless speed variation” “stepless speed regulation”等词组的搜索结果就一目了然地显示在你面前了!依靠google的关键词反显技术,“无级调速” 和 “speed”均以红色突出显示,非常醒目。 “引诱法”是利用google查询的最经典手段,其成败及效率高低决定于“诱导词”的选择。诱导词没选对,就可能让你白受累,笔者在寻找“一次性通过 ISO9000认证”中的“一次性”的地道英译时就曾吃过不少苦头,接连用了once,one, first, 等多个诱导词查看了几十个网页都查不到理想译法,直到过了好几天突然来了灵感,起用attempt作为诱导词,才找到了满意译法:at the first attempt。 上例皆选用目标语译词成分充作诱导词,这是效率最高的,但它对使用者有要求,即必须能准确猜出目标语译词中的一部分,如果你对目标语译词茫无头绪,从何下手就成了难题。比如我要译一个菜单名:“金钱肚”,我除了知道这是个菜名外,其它的一概不知,怎么办?那就要找一个目标语相关词,即在一个包含金钱肚英译的网页里,极有可能同时出现的一个词,比如,menu(既然菜名搞了英译,那么想想上面还应有“菜单”的英文吧!)、meat(这金钱肚说什么都可能是一种肉或者和其它肉类摆在一起的吧!)等等。 当然,诱导词也不一定非得是目标语不可,查中文英译时也可用中文引诱词,如“英文名称”(输入“第七届中国国际食品和饮料展览会. 英文名称”,会查到: “第七届中国国际食品和饮料展览会. 英文名称: SIAL CHINA”。),相似的此类引诱词还有:“英文”、“中英对照”、“英语”等等,但这种引诱词成功率很低,可作为备用手段。 查找中英对照内容,除了用“引诱法”,还有其它一些办法: 比如要查某个单位的英文名。现在大部分上规模的单位都有官方网站,所以直达其网站就是最好的办法, 在google中输入:“allintitle: "中国酒类商业协会"” 注:allintitle是google的查询功能词,意思是“以下关键词出现在title中”,按照网站的通用准则,单位名称一般都会出现在单位官方网站的title中。 作为辅助翻译工具,GOOGLE还有一个非常重要的作用:试对作用,即用尝试法寻找某种英语达方式和采用“翻译统计学”原理检验某种译法是否妥当或地道。 比如,我要翻译“ 相对水平120°-170°范围内无级调节”, 我知道“无级调节”是“stepless adjustment”,“水平”是 “the horizontal”,“度”是 “degrees”,但不知这个“相对水平…度” 怎么表达最恰当?再具体点,就是中间这个介词选什么好定不下来。输入“" degrees * the horizontal" site:.us”,(注:*是通配符,即可代替任何一个词),google一下,就看到以下类似表达: at an angle of 60 degrees above the horizontal; at an angle of 20 degrees from the horizontal; in the zone from fifteen degrees below the horizontal。 据此判断,选择“from the horizontal.”是本例最佳译法。 在上例中,将关键词加半角引号,是表示这几个词是前后相连的,按顺序不可掉换的,如果不加引号,google就可能返回所有包含有 degrees 和horizontal的网页,而不管其如何组合。 后面的site:.us表示只在以.us结尾的域名网页中查找关键词,这一点很重要。因为互联网是个大杂烩,上面出现的英语也是良莠不齐,如果不加选择,就可能查到好多劣质英语,被其误导。比如,你想验证一下“交通便利”的英译是不是convenient traffic,输入google,搜索所有网页,你可以得到42400项返回结果——这是不是说明这个翻译是地道的呢?当然不对,你若细加分析,这42400项结果绝大多数是来自中国人编的网页,是典型的中国式英语。 所以要想查证地道的美式英译,你就该在美国人编的网站上搜索,要想查证地道的英式英译,你就该在英国人编的网站上搜索。那么怎么判断某个网站是美国人或英国人编的呢?这里面没有万能的绝对正确的方法,但我们可以用以下方法一试。 国际互联网的域名体系主要有二种,一种是以.com、.net等结尾的功能体系,另一种是以.us、.cn、.uk等结尾的区域体系。任何一个以.com 结尾的域名,由于全世界的人都可以申请,所以你根本判断不出网站编制者和所有者的来路,但是第二种体系的域名就不一样,以.us为例,这是特别分配给美国的顶级域名,以此结尾的域名其使用者基本上来自美国本土,当然也包括一些在美国有业务的外国单位,但不会很多,所以如果你把搜索范围限定于.us,则返回结果基本上可认定为是标准美国英语。 有关域名后缀与国家(地区)名分别如下对应: 中国 香港 台湾 新加坡 日本 美国 英国 加拿大 澳大利亚 .cn .hk .tw .sg .jp .us .uk .ca .au 既然google的查询功能词“site:”为我们提供了限定查询网页的功能,那我们就可以方便地使用之,要想查英国英语就输入site:.uk,查加拿大英语,就输入site:.ca。 另外,还可以通过限定网页格式的方法来提高查询质量,网上常见的网页格式及相应的文件名后缀有:.htm或.html(超文本文件)、.txt (文本文件)、.pdf ( adobe acrobat PDF文件)、 .doc( WORD文件)、 .xls( EXCEL文件)、 .ppt (Powerpoint 文件) 最普遍的网页格式是超文本文件,即以.htm为后缀的,同时这也是最容易被粗制滥造的网页,一般来说,.pdf等特殊格式的文档由于其制作上较为复杂,一般需要作者精心准备,所以其文章质量相对高些,由此类推,.pdf、.ppt、 .doc、.xls文件的翻译质量也应比.htm类型高。Google提供了filetype这个功能词来选择搜索文件格式,例如在搜索框中输入:“ 组织机构 filetype:.pdf”,即搜索所有包含有“组织机构”的 PDF文件。 我们对自己的某些翻译满意与否,凭自身的感觉是没用的,毕竟我们在英语文化氛围中泡的时间不长,就是泡的时间较长,要想拥有对母语般的那种感觉,几乎是不可能的;那么怎么办呢?我的建议是:充分利用google的各种查询手段,以“语言学网络统计”的方法来评判某种译法的优劣。 就如前述“一次性通过”的英译“pass at the first attempt”,我为什么觉得这个比较地道呢,而不是从别的词典中查到的 “ pass without retrying”, 那是因为将前者用引号引起来输入google,返回结果565项,而后者返回结果只有一项。 善用“翻译统计法”,就好比为自己找来了一位万能的导师,可以在“他”引导下找到最佳译法。 例1,“排名第一”的准确表达,不知是ranks first, ranks the first 还是ranks at the first,google一下: ““ranks first “ site:.us ”返回结果:9,190 “" ranks the first" site:.us ” 返回结果:70项,且其中好些结果是:”ranks. The first”形式的,即ranks 和the first 分属二个句子的。 “" ranks at the first" site:.us ” 返回结果: 1项 故正确译法是:ranks first. 例2,中文“长江三峡,是当今世界上最大的水利枢纽工程.” 英译:The Yangtze Three Gorges Project (TGP) is the largest hydropower-complex project ever built in the world 想验证一下其中的“水利枢纽工程”之英译hydropower-complex project是否准确。 输入“‘hydropower-complex project’site:.uk” 只有5项,而hydropower complex(不含 project) 却有745项,再挑一二项细加研究,就可发现,“水利枢纽工程”之正确英译是hydropower-complex ,不必也不应带上 project. 在实际从事翻译工作时,为最大程度地利用网络资源,我们往往将google的二种功能,即查词功能和试对功能,结合使用。 例3:查“固体芳香剂”的译法。 按前述方法输入“固体芳香剂,solid”,查得一种译法是 solid air freshener,对不对呢?再输入到“ “solid air freshener” site:.us”,返回结果725项,且粗略一看上面的英文大意,基本上和中文用途吻合,OK, 就是它了. 另外,还可以用google的图片查询功能来帮助翻译,特别是英译中方向,比如,笔者在翻译一篇灯具文章中遇到这二个词 straight batten holder和angle batten holder ,我知道holder 是灯座,但前面的 straight/angle batten却不知如何是好,照字面直译是“直板式灯座”和“弯板式灯座”,但中文灯具术语中没有这种说法,怎么办?我便把“angle batten holder ” 输入到google中进行图片(image)查询,看一看返回的图片,是何物一目了然,虽然仍说不准其中文术语,但只要拿这个图片给客户一看,客户便完全明白了。 最后,还要附带一句,google最近推出的工具条(google toolbar),具有网页即指即译(英译中)功能,把它下载下来弄到IE工具栏上,为我们的因特网辅助翻译又平添了一分方便。 翻译是一项古老的职业,而因特网却是个全新的现代技术,努力促成古老的翻译与全新的因特网之间的联姻,催生出“因特网辅助翻译”这个新生儿,势必会给翻译界带来革命性的新变化,开创高科技时代的翻译新纪元。 Google是无意中充当了IAT的工具,而中国译典则是自她诞生的第一天起便为IAT而呼吸,将二者结合起来,将中国IAT事业不断推向前进,则是我呕心沥血、矢志不渝的终极目标! GOOGLE搜索在翻译中的应用 来源: 翻译帝国    目录 1 前言 3 2 摘要 3 3 如何使用本文 3 4 GOOGLE简介 4 5 搜索入门 4 6 初阶搜索 4 6.1 搜索结果要求包含两个及两个以上关键字 5 6.2 搜索结果要求不包含某些特定信息 5 6.3 搜索结果至少包含多个关键字中的任意一个 5 6.4 “+”、“-”和“OR”的混合查询 5 6.5 用“+”和“-”减少冗余信息 6 7 辅助搜索 6 7.1 通配符问题 6 7.2 关键字的字母大小写 6 7.3 搜索整个句子 6 7.4 搜索引擎忽略的字符和词汇 7 7.5 强制搜索 7 8 进阶搜索 7 8.1 对搜索的网站进行限制 7 8.2 查询某一类文件(往往带有同一扩展名) 8 8.3 搜索的关键字包含在URL链接中 9 8.4 搜索的关键字包含在网页标题中 9 9 其他罕用语法 10 9.1 搜索所有链接到某个URL地址的网页 10 9.2 查找与某个页面结构内容相似的页面 10 9.3 从GOOGLE服务器上缓存页面中查询信息 10 9.4 info 10 10 图片搜索 11 11 目录内搜索 11 12 新闻组(USENET)搜索 12 13 GOOGLE的其他杰出功能 12 13.1 集成化的工具条 12 13.2 单词英文解释 13 13.3 网页翻译 13 13.4 搜索结果过滤 13 14 搜索技巧之关键词选择初探 13 15 常用搜索个案 14 15.1 找人 14 15.2 找软件 15 15.3 找图片 15 15.4 找MP3 16 15.5 找书 16 16 GOOGLE搜索FAQ 16 17 后记 17 1 前言 我是在2000年上半年知道GOOGLE的。在这之前,我搜索英文信息通常用AltaVista,而搜索中文信息则常用Sina。但自使用了GOOGLE之后,它便成为我的Favorite Search engine了。这也得感谢新浪网友曹溪,因为当初正是因为他的大力推介,才使我识得了GOOGLE。 记得1996年夏季的时候,当我第一次接触Internet,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真是妙不可言。在经历了疯狂的WWW冲浪和如痴如醉的BBS沉迷之后,我意识到Internet对我影响至深的还是在于学习方式的变迁。 如何来描述这种变迁呢?以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信息中提取所需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信息领域大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了。比方说,我们到了大型的图书城,往往有一种不知所措的感觉。旧有的学习方式需要变更以适应这个信息爆炸的年代。目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。我不妨把这称为“即学式”,相应的,旧有的称为“预学式”。 不过,“即学式”的实施是有前提的。首先,要求学习者拥有一个包罗万象的信息库,以供随时抽取各种目的信息;其次,是需要一个强劲的信息检索工具,以便高效率的从信息库中提取信息。很明显,Internet可以充当那个海量的信息库,而搜索引擎,则正是寻找光明之火的绝好工具。 “公欲善其事,必先利其器”。Internet只有一个,而搜索引擎则有N多个。有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大。用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望。不同的时期,涌现出不同的强者。就目前而言,我们非常幸运的有了: *****GOOGLE***** 2 摘要 本文简要的介绍了GOOGLE的历史和特点,GOOGLE的基本搜索语法和高级搜索语法,GOOGLE的特色功能,包括图片搜索、新闻组搜索和集成工具条等,还简单的介绍了一些常用搜索技巧和实用个案。尽管本文名为“GOOGLE搜索从入门到精通”,但事实上,笔者对运用GOOGLE进行搜索也尚处于“入门”阶段。 3 如何使用本文 阅读本文最好具备一些最基本的布尔代数基础,如“与”、“或”、“非”等。不过,即便你没有这方面的知识,也不必在意。对那些实例进行练习,你的疑惑就会迎刃而解。对于刚刚接触网络搜索的读者而言,也许你应该从头到尾的阅读本文;但对于那些有一定搜索基础的读者而言,只需要跳跃着寻找自己所需要的信息就可以了。当然,如果你有一定的英文基础,也可以把本文与GOOGLE大全(http://www.google.com/about.html)参照阅读,那样效果会更好。 4 GOOGLE简介 Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。 GOOGLE的成功得益于其强大的功能和独到的特点: l GOOGLE支持多达132种语言,包括简体中文和繁体中文; l GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘; l GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带; l GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果; l GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介; l GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站; l GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。 5 搜索入门 要用GOOGLE做搜索,当然首先要进GOOGLE网站--www.google.com;不过,163.com和yahoo.com.cn使用的实际上也是GOOGLE搜索引擎,只是对搜索结果进行了编排,但无法提供一些特色功能,如图片搜索等。 第一次进入GOOGLE,它会根据你的操作系统,确定语言界面。需要提醒的是,GOOGLE是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对GOOGLE界面进行个人设定了。 GOOGLE的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,要查找所有关于“易筋经”的中文网站和网页。在搜索框内输入一个关键字“易筋经”,然后点击下面的“google搜索”按钮(或者直接回车),结果就出来了。 搜索:“易筋经” 结果:已搜索有关易筋经的中文(简体)网页。共约有5,930项查询结果,这是第1-10项 。 搜索用时0.12秒。 6 初阶搜索 在上例子中,你已经知道了最基本的搜索,即查询包含单个关键字的信息。现在,进一步探讨多个关键字以及关键字间不同逻辑关系的查询。 6.1 搜索结果要求包含两个及两个以上关键字 一般搜索引擎需要在多个关键字之间加上“+”,而GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。 示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页 搜索:“易筋经 吸星大法” 结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有774项查询结果,这是第1-10项 。 搜索用时0.24秒。 注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。 6.2 搜索结果要求不包含某些特定信息 GOOGLE用减号“-”表示逻辑“非”操作。 示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页 搜索:“易筋经 -吸星大法” 结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。共约有5,150项查询结果,这是第1-10项 。 搜索用时0.40秒。 注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 - 吸星大法”,搜索引擎将视为关键字为易筋经和吸星大法的逻辑“与”操作,中间的“-”被忽略。 6.3 搜索结果至少包含多个关键字中的任意一个 GOOGLE用大写的“OR”表示逻辑“或”操作。假定你是布兰妮和批头士的歌迷,现在要查找所有关于布兰妮和批头士的中文网页。 示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。 搜索:“Britney OR Beatles OR 布兰妮 OR 批头士” 结果:已搜索有关Britney OR Beatles OR 布兰妮 OR 批头士的中文(简体)网页。 共约有31,300项查询结果,这是第1-10项。 注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。 6.4 “+”、“-”和“OR”的混合查询 混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。单纯的“或”操作也同样道理。但是,如果“或”查询和其他两种查询混合在一起,问题就复杂了。现在我们做这样的查询:“所有关于Britney或者Beatles、但是没有Madonna相关信息的中文网页”。 搜索:“Britney OR Beatles -Madonna” 结果:已搜索有关Britney OR Beatles -Madonna的中文(简体)网页。共约有16,200项查询结果,这是第1-10项 。 搜索用时0.23秒。 搜索:“-Madonna Britney OR Beatles” 结果:已搜索有关-Madonna Britney OR Beatles的中文(简体)网页。共约有16,200项查询结果,这是第1-10项 。 搜索用时0.13秒。 搜索:“Britney -Madonna OR Beatles” 结果:找不到和您的查询-Britney -Madonna OR Beatles-相符的网页 搜索:“Britney OR -Madonna Beatles” 结果:找不到和您的查询-Britney OR -Madonna Beatles -相符的网页 可见,“或”操作的前后两个关键字必须是默认的“与”查询,否则,搜索引擎将无法完成搜索。 6.5 用“+”和“-”减少冗余信息 通常情况下,用一个关键字查询,会得到很多和查询目的不相关的冗余信息。我们总是希望,搜索结果的第一个条目中就包含所需要的信息。“+”和“-”很多时候就起到缩小搜索结果的范围,以提高查询结果命中率。 例:查阅天龙八部具体是哪八部。 分析:如果光用“天龙八部”做关键字,搜索结果有20,300项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。 1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字。“天龙八部阿修罗”的搜索结果就只有1,050项,可以很快找到全部八部。 2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录。“天龙八部佛教 -金庸”的查询结果为1,120项,可以迅速找到需要的资料。 7 辅助搜索 7.1 通配符问题 很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。GOOGLE不支持通配符,只能做精确查询,关键字中的“*”或者“?”会被忽略掉。 7.2 关键字的字母大小写 GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。 7.3 搜索整个句子 GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。 示例:搜索包含“long, long ago”字串的页面。 搜索:“"long long ago"” 结果:已搜索有关long long ago的中文(简体)网页。共约有16,500项查询结果,这是第1-10项 。 搜索用时0.06秒。 。 7.4 搜索引擎忽略的字符和词汇 GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。 示例:搜索关于第一次世界大战的信息 搜索:“"worldwar i"” 结果: "i"使用过于频繁,没有被列入搜索范围。已向英特网搜索"worldwar i". 共约有7,370项查询结果,这是第1-10项 。 搜索用时0.17秒。 7.5 强制搜索 如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。 示例:搜索包含“Who am I ?”的网页。如果用“"who am i ? "”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。 搜索:“"+who +am +i"” 结果:已向英特网搜索"+who +am +i". 共约有332,000项查询结果,这是第1-10项 。 搜索用时3.68秒。 注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。 8 进阶搜索 上面已经探讨了GOOGLE的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。 8.1 对搜索的网站进行限制 “site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。 示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。 搜索:“金庸 site:edu.cn” 结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有1,730项查询结果,这是第1-10项 。 搜索用时0.23秒。 示例:搜索包含“金庸”和“古龙”的中文新浪网站页面, 搜索:“金庸 古龙 site:sina.com.cn” 结果:已在sina.com.cn搜索有关金庸 古龙 的中文(简体)网页。共约有734项查询结果,这是第1-10项 。 搜索用时0.12秒。 示例:搜索新浪文教频道中关于鲁迅的信息。 搜索:“鲁迅 site:edu.sina.com.cn” 结果:已在edu.sina.com.cn搜索有关 鲁迅的中文(简体)网页。共约有672项查询结果,这是第1-10项 。 搜索用时0.24秒。 注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。 8.2 查询某一类文件(往往带有同一扩展名) “filetype:”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。 最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档大约有2500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。 示例:搜索关于电子商务(ECOMMERCE)的PDF文档。 搜索:“ecommerce filetype:pdf” 结果:已向英特网搜索ecommerce filetypedf. 共约有25,500项查询结果,这是第91-100项 。 搜索用时0.44秒。 下面是某项搜索结果: [PDF] www.ecommerce.gov/apec 文档类型: PDF/Adobe Acrobat - 一般文字档 Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCE READINESS ASSESSMENT GUIDE www.ecommerce.gov/apec Page 2. ... www.ecommerce.gov/apec/docs/read ... adiness_guide_5.pdf - 类似网页 可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。 搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurl:pdf ecommerce”。搜索结果数量大致相同,不过查询结果顺序则略有很大差别。 注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的。 “filetype”的另一个强大用处则在图片搜索。下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。进入“http://images.google.com/”,查找关于本拉登的JPG图片。 搜索:“Bin Laden filetype:jpg” 结果:搜索有关 Bin Laden filetype:jpg 的图片( #ㄊ匝榘妫?共约有1,630项查询结果,这是第1-20项 。搜索用时0.14秒。 除此之外,我尚未发现其他的filetype用法。如果有谁知道,请给我发邮件。预先感谢。 8.3 搜索的关键字包含在URL链接中 “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。 示例:查找MIDI曲“沧海一声笑”。 搜索:“inurl:midi 沧海一声笑” 结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有16项查询结果,这是第1-10项 。 搜索用时0.16秒。 示例:查找[M$]网站上关于windows2000的安全课题资料。 搜索:“inurl:security windows2000 site:[M$].com” 结果:已在[M$].com内搜索有关inurl:security windows2000 的网页。 共约有188项查询结果,这是第1-10项 。 搜索用时0.27秒。 注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。 “allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。 示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。 语法:“allinurl:"cgi-bin" phf +com” 搜索:已向英特网搜索allinurl: "cgi-bin" phf +com. 共约有37项查询结果,这是第1-10项 。 搜索用时0.36秒。 8.4 搜索的关键字包含在网页标题中 “intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:查找日本明星藤原纪香的照片集。 搜索:“intitle:藤原纪香 写真” 结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有465项查询结果,这是第1-10项 。 搜索用时0.16秒。 利用Google在线翻译引擎制作自己的多国语言翻译机 出处:blogjava 作者:ekinglon 更新时间:2007-1-1 19:17:42   本文介绍如何利用Google在线翻译引擎来制作自己的多国语言翻译器。本程序利用Google的在线翻译引擎实现汉语到英语,英语到汉语,英语到日语的单词,整句的翻译。因为是在命令行运行,不支持\n,不能对文章、段落进行翻译,不过稍微做一个Application 程序扩展一下就可以了。 因为是刚刚接触java 的网络编程,如果有不当之错,还请各位看官指证。 本类可以直接在命令行下使用: java ekinglong.languageEngine.GoogleTranslationEngine2 [text] [langpair]   说明: [text]表示要翻译的文本,可以有空格,这样支持英语的整句翻译。 [langpair]是指定翻译语言对值。这个翻译引擎类支持“汉语译英语”,“英语译汉语”和“英语译日语”,它们分别对应的翻译语言对值是:cn-en , en-cn , en-ja。 示例如下: 示例1:将英语“hello”翻译成“日语” java ekinglong.languageEngine.GoogleTranslationEngine2 hello en - ja 结果1: 翻译内容:hello Google翻译结果:こんにちは 示例2:翻译英文句子“hello, the world!”到中文。 java ekinglong.languageEngine.GoogleTranslationEngine2 hello,the world !  en - cn 结果2: 翻译内容:hello, the world ! Google翻译结果:你好,世界 ! 示例3:将汉语“你好 世界”翻译成英语 java ekinglong.languageEngine.GoogleTranslationEngine2  你好 世界 cn - en 结果3: 翻译内容:你好 世界 Google翻译结果:Hello world 下面是实现代码: INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192046744.gif" \* MERGEFORMATINET /** */ /**  * 利用Google在线翻译引擎实现多国语言互译  * 这里只使用google的对译项目  * 目前只针对中日英,且因为google不提供中日直接互译,  * 所以,此引擎也不能进行中日对译  *   *  @author  ekinglong  *  @version  1.0 06/10/30   */ package  ekinglong.languageEngine;     import  java.io. * ;   import  java.net. * ;   INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192046744.gif" \* MERGEFORMATINET   public   class  GoogleTranslationEngine2 {             // 定义互译语言对常数变量,符合google页面相关对译语言对的值       public   static   final 利用Google在线翻译引擎制作自己的多国语言翻译机 出处:blogjava 作者:ekinglon 更新时间:2007-1-1 19:17:42    String LANGPAIR_CN_EN = " zh-CN|en " ; // 汉语到英语       public   static   final  String LANGPAIR_EN_CN = " en|zh-CN " ; // 英语到汉语       public   static   final  String LANGPAIR_EN_JA = " en|ja " ; // 英语到日语             // 定义编码常数       public   static   final  String CHARSET_CN = " GBK " ;       public   static   final  String CHARSET_JA = " Shift_JIS " ;             // google在线翻译引擎url       static   final  String engineUrl = " http://translate.google.com/translate_t " ;        INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       /** */ /**       * 利用google在线翻译引擎实现翻译,并获取翻译内容       *  @param  translateText 要翻译的文本内容       *  @param  langpair 对译语言的值对,如en|ja是由英语翻译到日语        */       public  String translate(String translateText,String langpair)  INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET           throws  MalformedURLException,IOException,UnsupportedEncodingException {                     // text是google翻译页面提交时对于欲翻译文字的变量名           // langpair是google翻译页面提交时对于采用何种互对语言的变量名          String urlstr = engineUrl + " ?text= " + encodeText(translateText) + " &langpair= " + langpair;          URL url  =   new  URL(urlstr);          URLConnection connection  =  (HttpURLConnection)url.openConnection();          connection.setRequestProperty 利用Google在线翻译引擎制作自己的多国语言翻译机 出处:blogjava 作者:ekinglon 更新时间:2007-1-1 19:17:42   ( " User-agent " , " IE/6.0 " );  // 必须,否则报错,到于FF的怎么写,没做过测试                  connection.connect();                    String charset = getCharsetFromLangpair(langpair); // 自动获取目标语言的编码          BufferedReader in = new  BufferedReader( new           InputStreamReader(connection.getInputStream(),charset)); // 使用指定编码接收数据                                     String line = null ;          StringBuilder sb = new  StringBuilder(); INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET           while ((line = in.readLine()) != null ) {              sb.append(line);          }          in.close();                              String translation = getContent(sb.toString());           return  translation;      }       INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       /** */ /**       * 从获得的源文件中剥取翻译内容       * 分析google翻译生成的html源码来看       * 翻译内容被置于
标签之间       *  @param  htmltext 获得的网业源代码        */ INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       private  String getContent(String htmltext) {          String ss = " " ;           String se = "
" ;           int  ssidx = htmltext.indexOf(ss);        &nbs 利用Google在线翻译引擎制作自己的多国语言翻译机 出处:blogjava 作者:ekinglon 更新时间:2007-1-1 19:17:42   p;  int  seidx = htmltext.indexOf(se,ssidx);                    String restr = htmltext.substring(ssidx + ss.length(),seidx);           return  restr;      }             // 将文本进行URL编码 INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       private  String encodeText(String text) {          String str = java.net.URLEncoder.encode(text);           return  str;      }       INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       /** */ /**       * 根据翻译的目标语言获取对应的接收编码       *             * @langpair 对译语言的值对,如en|ja是由英语翻译到日语        */ INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       private  String getCharsetFromLangpair(String langpair) {           // 当翻译的目标语言为日语时,采用Shift+JIS编码接收数据           if (langpair.equals(LANGPAIR_EN_JA))               return  CHARSET_JA;                     else   return  CHARSET_CN;      }       INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET       public   static   void  main(String[] args)  throws  Exception {          GoogleTranslationEngine2 engine = new  GoogleTranslationEngine2();          String text = " hello " ; 利用Google在线翻译引擎制作自己的多国语言翻译机 出处:blogjava 作者:ekinglon 更新时间:2007-1-1 19:17:42            String langpair = " en|ja " ; INCLUDEPICTURE "http://www.javafan.net/menu/UploadFiles_6289/200701/20070101192048641.gif" \* MERGEFORMATINET           if (args.length >= 2 ) {              StringBuilder sb = new  StringBuilder(); INCLUDEPICTURE "h
/
本文档为【如何利用google帮助翻译】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
相关资料
热门搜索
你可能还喜欢

历史搜索

    清空历史搜索