水淼·万能文章采集器v2.17.7.0绿色版

绿色软件
23年2月14日
编辑

那点事

水淼软件出品的一款万能文章采集软件，可输入关键词采集各大搜索引擎网页和新闻，也可以采集指定网站文章。

基于水淼自主研发的正文识别智能算法，能在互联网纷繁复杂的网页中尽可能准确地提取出正文内容。

正文识别有自动识别（即以前的“标准”、“严格”模式）、“精确标签”、“头尾标记”。其自动识别能适应绝大多数网页的正文提取，而“精确标签”只需指定正文标签头，如“<div class=”text”>”，就能通吃所有网页的正文提取；头尾标记则是指定正文的开头和结尾。

关键词采集目前支持的搜索引擎有：百度、搜狗、360、谷歌、必应、雅虎

采集指定网站文章的功能也非常简单，只需要稍微设置（不需要复杂的规则），就能批量采集目标网站的文章了。

因为墙的问题，要使用谷歌搜索和谷歌转译文章的功能，需要使用VPN换国外IP。

软件截图：

下面是界面组件的说明：

采集分页：如果正文有分页显示，则自动采集分页合并

删除链接：删除网页中锚文本的链接功能，只留下锚文本的标题

txt 格式：保存成txt文本（自动清除HTML标签）

调试模式：在正文的开头插入“调试模式：标题和链接”的内容，以方便进入原网页对比正文识别效果

标题有关键词：只有标题中包含搜索关键词的网页才采集

放弃短标题：当自动识别的标题的长度低于原始标题三分之一时，即为短标题，通常这种标题是错误的，因此可以勾选放弃它，这样就使用原始标题（此段遇到时自会理解）。

删除外层代码：使用自动识别和精确标签时，通常都会包含<div id=”mm”></div>这样的外层代码，如果不需要，那就要打勾删除。

过滤正文：有些正文里包含了标题元素，如<h1><h2><h3>这三种需要删除，还有很多有class属性的标签也属于系统定义的非正文内容，比如 <p class=”ee”>推荐内容</p>，一般只要删除class代码，就能去掉绝大多数的非正文内容，然后跟着还有个例外编辑框，用于输入不能删除的class，直接填入class的值，多个值使用|隔开。

【精确标签】特别说明：

请使用谷歌浏览器或傲游浏览器，鼠标右键单击正文的开始位置-审查元素，然后定位正文的代码段，将该代码段的标签头复制。

如代码段：<div class=”text”>正文部分</div>，则复制<div class=”text”>

多个标签可以使用“|”隔开

关键词采集的文章自动比对本地相同标题的文章，相似度超过60%就跳过，低于60%就自动重命名保存。

下载权限

查看

￥

免费下载

评论并刷新后下载

登录后下载

查看演示

{{attr.name}}：

您当前的等级为

登录后免费下载登录小黑屋反思中，不准下载！评论后刷新页面下载评论支付以后下载请先登录您今天的下载次数（次）用完了，请明天再来支付积分以后下载立即支付支付以后下载立即支付您当前的用户组不允许下载升级会员

您已获得下载权限您可以每天下载资源次，今日剩余次

本站所有资源均通过互联网公开渠道收集整理，版权归原创者所有！本站不提供任何保证，并不承担任何法律责任，您必须在下载后的24个小时之内，从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容，请支持正版!如果对您的版权或者利益造成损害，请联系客服予以删除。敬请谅解！

{{userData.name}}已认证

水淼·万能文章采集器v2.17.7.0绿色版

水淼·WordPress站群文章更新器v1.3.6.0绿色版

Bilibili多功能养号框架，支持多开，批量抽奖

蓝海高利润，车载U盘项目，适合0基础小白，一部手机轻松实现日入500+

166】小胡百度贴吧防删无限引流技术实战培训

推荐一个月入过万的项目，高校QQ群付费进群了解下

利用抖音音乐号引流，卖音乐U盘赚钱

少林点穴功夫少林实战擒拿制敌

抖音本地生活类实体商家基础+高级服务

免费共享教室源源不断获得客户被动赚大钱的核心商业模式

如何利用视频号IP进行被动精准引流？

全自动躺赚资源付费网站项目：年赚20万长期项目（详细教程+源码）23年更新

276】《绝密内幕资讯》

{{userData.name}}已认证

水淼·WordPress站群文章更新器v1.3.6.0绿色版

Bilibili多功能养号框架，支持多开，批量抽奖

蓝海高利润，车载U盘项目，适合0基础小白，一部手机轻松实现日入500+

166】小胡百度贴吧防删无限引流技术实战培训

推荐一个月入过万的项目，高校QQ群付费进群了解下

利用抖音音乐号引流，卖音乐U盘赚钱

少林点穴功夫 少林实战擒拿制敌

抖音本地生活类实体商家基础+高级服务

免费共享教室源源不断获得客户被动赚大钱的核心商业模式

如何利用视频号IP进行被动精准引流？

全自动躺赚资源付费网站项目：年赚20万长期项目（详细教程+源码）23年更新

276】《绝密内幕资讯》

少林点穴功夫少林实战擒拿制敌