采集插件|翻译插件|Google谷歌翻译插件

信息来源

火车头采集

http://faq.locoy.com/search.html?&keyword=%E7%BF%BB%E8%AF%91
翻译搜索

http://faq.locoy.com/q-1024.html

google翻译插件V7,V8版,支持多种翻译 使用说明

http://faq.locoy.com/q-1205.html
Google谷歌翻译插件更新(20200612)

http://faq.locoy.com/q-1298.html
V9集成旧版本的免费翻译插件功能

非官方-第三方翻译插件

https://blog.csdn.net/nunv333/article/details/107179049

火车头V9翻译插件-终极稳定版(翻译10000篇文章不报错)

https://blog.csdn.net/nunv333/article/details/107176530

适用于火车头7.6的翻译插件-亲测10000篇文章稳定不报错

简数采集

https://blog.csdn.net/keydatas/article/details/110174977
简数采集百度、有道、谷歌翻译使用教程

文章内容


翻译搜索

google翻译插件V7,V8版,支持多种翻译 使用说明
该插件利用google的在线翻译功能,将各种语言进行翻译。需要注意的是,使用该插件的翻译后采集速度将会受到一些影响。插件会将内容标签中的语言进行翻译。注意事项 :您的采集器的版本必须是V7 V8系列旗舰版采集器以上版本才可以使用。使用方法:1.下载插件google翻译插件: ht…

Google谷歌翻译插件更新(20200612)
该插件会利用google的在线翻译功能,将各种语言进行翻译。需要注意的是,使用该插件的翻译后采集速度将会受到一些影响。插件会将内容标签中的语言进行翻译。注意事项 :您的采集器的版本必须是V8,V9系列才可以使用。使用方法:1.下载插件将本文中的插件下载后放在 Plugins 目录下。2.在…

V9集成旧版本的免费翻译插件功能
在V9中内置翻译的插件,使用以下步骤:1.下载下面这个压缩包,并解压到采集器根目录下,注意解压的过程中要关闭火车采集器翻译插件点击下载链接2.若您是32位系统,那么现在直接重启下火车采集器即可使用翻译插件。 若您是64位系统,那么您需要使用在火车采集器目录打开任务管理器,打开方法是:win…

百度翻译插件更新(20171201)
支持多语言翻译支持多级翻译比如 汉翻译英语,再英语翻译法语;zh: 中文jp: 日语th: 泰语fra: 法语en: 英语spa: 西班牙语kor: 韩语vie: 越南语de: 德语ru: 俄语ara: 阿拉伯语est: 爱沙尼亚语bul: 保加利亚语pl: 波兰语dan: 丹麦语fin: 芬兰语n…


google翻译插件V7,V8版,支持多种翻译 使用说明

该插件利用google的在线翻译功能,将各种语言进行翻译。需要注意的是,使用该插件的翻译后采集速度将会受到一些影响。插件会将内容标签中的语言进行翻译。

注意事项 :您的采集器的版本必须是V7 V8系列旗舰版采集器以上版本才可以使用。

使用方法:

1.下载插件google翻译插件: http://board.locoy.com/?post=94 (V7 V8版本附件不同,请对应下载使用)

将本文中的插件下载后放在 采集器 \Plugins 目录下。

2.在编辑任务的文件保存部分C#插件部分启用该插件

3.插件默认是汉译英,如果您是汉译英,直接使用即可。如果您的翻译方向是其它的,则需要进行额外设置。

首先,您需要新建一个标签,名子叫 ” 翻译方向 “,然后给这个标签给一个固定的参数 。参数的形式为 源语言代码>目标语言代码。 如图 zh-CN>fr是汉翻法。

点击查看原图

设置完这个参数后,插件将会按您的设置将一种语言翻译成另一个语言。如果需要繁体翻译成中文,方向标签里的内容是 zh-TW>zh-CN,法译德是 fr>de,其它的以此类推。还支持多层翻译,如 zh-CN>en>fr ,可以先翻译成英文,再从英文翻译成法文.层数不限.(各种语言的代码在最下面)

更高级的用法:

如果您需要对多个标签进行翻译,您可以再新建一个标签,名子叫 “翻译标签” ,如您需要翻译“标题”和“内容”两个标签 ,你的这个标签的内容就是 “标题,内容” .如果您需要翻译 “简介”和”说明”两个标签,您需要填写 “简介,说明” 。注意多个标签名之间以半角的英文逗号相连。最后插件就会自动去翻译您所设置的标签。该标签的设置和上面的翻译方向的设置使用同样的方法。

具体的各种语言的代码如下:

中文:zh-CN
英语:en
中文(繁体):zh-TW
越南语:vi
阿尔巴尼亚语:sq
阿拉伯语:ar
阿塞拜疆语:az
爱尔兰语:ga
爱沙尼亚语:et
白俄罗斯语:be
保加利亚语:bg
冰岛语:is
波兰语:pl
波斯语:fa
布尔文(南非荷兰语):af
丹麦语:da
德语:de
俄语:ru
法语:fr
菲律宾语:tl
芬兰语:fi
格鲁吉亚语:ka
海地克里奥尔语:ht
韩语:ko
荷兰语:nl
加利西亚语:gl
加泰罗尼亚语:ca
捷克语:cs
克罗地亚语:hr
拉脱维亚语:lv
立陶宛语:lt
罗马尼亚语:ro
马耳他语:mt
马来语:ms
马其顿语:mk
挪威语:no
葡萄牙语:pt
日语:ja
瑞典语:sv
塞尔维亚语:sr
斯洛伐克语:sk
斯洛文尼亚语:sl
斯瓦希里语:sw
泰语:th
土耳其语:tr
威尔士语:cy
乌克兰语:uk
西班牙的巴斯克语:eu
西班牙语:es
希伯来语:iw
希腊语:el
匈牙利语:hu
亚美尼亚语:hy
意大利语:it
意第绪语:yi
印地语:hi
印度乌尔都语:ur
印尼语:id
越南语:vi


Google谷歌翻译插件更新(20200612)

该插件会利用google的在线翻译功能,将各种语言进行翻译。需要注意的是,使用该插件的翻译后采集速度将会受到一些影响。插件会将内容标签中的语言进行翻译。

注意事项 :您的采集器的版本必须是V8,V9系列才可以使用。

使用方法:

1.下载插件

将本文中的插件下载后放在 Plugins 目录下。

2.在其他设置的插件处选择该插件

3.插件默认是汉译英,如果您是汉译英,直接使用即可。如果您的翻译方向是其它的,则需要进行额外设置。

首先,您需要新建一个标签,名子叫 翻译方向 ,然后给这个标签给一个固定的参数 。参数的形式为 源语言代码>目标语言代码。 如图 zh-CN>fr是汉翻法。

设置完这个参数后,插件将会按您的设置将一种语言翻译成另一个语言。如果需要繁体翻译成中文,方向标签里的内容是 zh-TW>zh-CN,法译德是 fr>de,其它的以此类推。还支持多层翻译,如 zh-CN>en>fr ,可以先翻译成英文,再从英文翻译成法文.层数不限.

具体的各种语言的代码如下:

  • 中文:zh-CN
  • 英语:en
  • 中文(繁体):zh-TW
  • 越南语:vi
  • 阿尔巴尼亚语:sq
  • 阿拉伯语:ar
  • 阿塞拜疆语:az
  • 爱尔兰语:ga
  • 爱沙尼亚语:et
  • 白俄罗斯语:be
  • 保加利亚语:bg
  • 冰岛语:is
  • 波兰语:pl
  • 波斯语:fa
  • 布尔文(南非荷兰语):af
  • 丹麦语:da
  • 德语:de
  • 俄语:ru
  • 法语:fr
  • 菲律宾语:tl
  • 芬兰语:fi
  • 格鲁吉亚语:ka
  • 海地克里奥尔语:ht
  • 韩语:ko
  • 荷兰语:nl
  • 加利西亚语:gl
  • 加泰罗尼亚语:ca
  • 捷克语:cs
  • 克罗地亚语:hr
  • 拉脱维亚语:lv
  • 立陶宛语:lt
  • 罗马尼亚语:ro
  • 马耳他语:mt
  • 马来语:ms
  • 马其顿语:mk
  • 挪威语:no
  • 葡萄牙语:pt
  • 日语:ja
  • 瑞典语:sv
  • 塞尔维亚语:sr
  • 斯洛伐克语:sk
  • 斯洛文尼亚语:sl
  • 斯瓦希里语:sw
  • 泰语:th
  • 土耳其语:tr
  • 威尔士语:cy
  • 乌克兰语:uk
  • 西班牙的巴斯克语:eu
  • 西班牙语:es
  • 希伯来语:iw
  • 希腊语:el
  • 匈牙利语:hu
  • 亚美尼亚语:hy
  • 意大利语:it
  • 意第绪语:yi
  • 印地语:hi
  • 印度乌尔都语:ur
  • 印尼语:id
  • 越南语:vi

附件下载:

V8版本:

google翻译插件v8

V9版本:

需要注意V9版本的谷歌插件分为32位以及64位两个版本,请根据操作系统来选择相应的版本使用。

google翻译插件V9


V9集成旧版本的免费翻译插件功能

在V9中内置翻译的插件,使用以下步骤:

1.下载下面这个压缩包,并解压到采集器根目录下,注意解压的过程中要关闭火车采集器

翻译插件点击下载链接

2.若您是32位系统,那么现在直接重启下火车采集器即可使用翻译插件。

 若您是64位系统,那么您需要使用在火车采集器目录打开任务管理器,打开方法是:win7及以上版本支持,按住“shift”键,然后鼠标右击,在弹窗中选择“在此处打开命令窗口”。如下图所示:

并运行指令:CorFlags.exe LocoySpider.exe /32BIT+,然后重启火车采集器即可调用旧版本翻译插件。这里注意如果运行指令报错,那么应该是火车采集器没有关闭,请先将火车采集器关闭,然后再运行指令。

注:关于如何快速在火车采集器目录打开cmd,可以参考:https://jingyan.baidu.com/article/6525d4b170f452ac7c2e9466.html

旧版本翻译插件的使用方法:

(1)先建立一个标签

翻译标签:要翻译的标签名称

注意这个插件只能汉译音,所以只有一个翻译方向,不用再另外写翻译方向

(2)调用插件

(3)运行效果如下图


非官方-第三方翻译插件

https://blog.csdn.net/nunv333/article/details/107179049

火车头V9翻译插件-终极稳定版(翻译10000篇文章不报错)

https://blog.csdn.net/nunv333/article/details/107176530

适用于火车头7.6的翻译插件-亲测10000篇文章稳定不报错

因为php插件和python插件带来的效率降低问题,如无特别说明,本博客开发的火车头插件一律使用C#开发

  最近经常看到有人需要翻译插件,官方的翻译插件是V9版本虽然能用,但是这个插件有不少问题,可能是因为他们这个插件免费开放的缘故吧,不会去进行大量测试,也不会根据客户反馈的问题去修改完善代码!

  没办法,官方的不好用,只能自己动手开发了,毕竟自己动手丰衣足食嘛,插件仍然是用C#开发,可以锁定翻译间隔,避免了php翻译插件和python插件不能锁定时间间隔导致一用就被限制的问题

好了,老规矩,仍然是先上效果图

  1. 这是使用翻译插件之前的测试结果

2.这是使用插件之后的翻译结果,因为是采集爬取网页信息,同火车头7.6翻译插件一样针对HTML标签做了特别优化,即翻译之前过滤掉不必要的html标签,并抽取出 h1-6、img标签,翻译之后将 h1-6、img标签归位,并为文章补上p标签

3.采集效果,这里给个gif动态图吧,经过反复测试和校验,修复完善代码,最后几次测试的结果是翻译10000篇没有报错,这是爬取和翻译效果

翻译插件仍然是用C#开发,需要的朋友可自取。

链接: https://pan.baidu.com/s/1guvy6hBMK_6egzKkbs7hCA 提取码: 4vvg


简数采集百度、有道、谷歌翻译使用教程

简数采集平台已集成百度、有道、谷歌翻译,可在采集过程中将文字内容翻译成英语、西班牙语、法语和日语等等。这样就大大方便地把中国的新闻、文章等翻译后发布到部署在国外的站点,或可以把外国的精品内容翻译成中文,做优良文化、知识的传播者。

操作步骤如下:
一、添加翻译规则
点击控制台左侧列表的 “SEO配置管理” ==》点击 “SEO&翻译规则管理” ==》点击 “+翻译规则定义” ,新建一个翻译规则;

二、翻译规则配置

  1. 选择翻译的字段,默认是content和title字段,如需填写其他字段,必须是在 “详情提取器” 中定义了的字段;
  2. 选择翻译的源语言和目标语言语种,目前支持中文,英文,西班牙语,法语,日语,泰语,越南语和阿拉伯语;

三、规则使用—-两种方式

  1. 手动执行

在任务的 “结果数据&发布” 选项卡里点击 “SEO&翻译工具” 按钮==》选择 “翻译执行” 栏==》选择相应的翻译规则==》选择翻译接口API(详情见步骤四)==》执行需翻译的数据;

  1. 自动执行

启用该功能,采集的数据会自动执行配置的翻译规则;

在任务的 “自动化:发布&SEO&翻译” 选项卡里自动翻译配置处==》勾选上 “采集后,自动执行翻译” 选项==》选择执行的翻译规则==》选择翻译接口API==》选择执行范围,最后点击保存即可;

四、翻译接口API
简数采集平台目前支持的翻译接口API:谷歌翻译,百度翻译和有道翻译接口;

用户翻译接口的配置流程:

  1. 点击控制台左侧列表的 “公共配置管理” ==》点击 “翻译接口管理” ==》点击 “+百度通用翻译API” 或 “+有道翻译实例API” ,新建一个翻译接口;
  2. 填入自有接口的相关信息,保存后即可使用;

五、翻译结果

 
————————————————