蓝锂网络

蓝锂动态

蓝锂网络智能采集系统与今天正式发布,并发布到服务器提供开放测试!

时间: 2013-03-17 17:02:28 | 来源: 蓝锂网络 | 作者: 蓝锂网络 | 浏览:1465| 阅读设置: 【

声明:本文属蓝锂网络原创,欢迎转载,但请保留作者版权,作者在此表示感谢。
作者:深蓝  QQ: 1668142999
CMS技术交流QQ群:  213723527 (主要交流齐博系统采集技术,特别是地方门户和b2b系统的采集)
蓝锂官方站:https://www.lanelead.com
蓝锂技术论坛:http://bbs.lanelead.com  主要讨论如何有效利用定时自动采集结合伪原创技术, 帮助站长更好的运营网站。
蓝锂网络智能采集系统与今天正式发布,并发布到服务器提供开放测试!

蓝锂智能采集系统(核心:文章正文及分页自动识别技术)

蓝锂智能采集系统是蓝锂网络自主研发的一套网页正文智能识别和处理的智能采集系统.目前该系统正文识别精度99%以上,处于全国领先水平.和其他正文识别系统相比,我们采用了多层降噪处理和智能加权技术,因此识别更准确!欢迎大家进行正文识别测试和比较!

以下是我们开发程序的时候的部分测试文章网址:
$url = 'http://binzhou.ganji.com/rirongbaihuo/453023373x.htm'; //赶集网正文 带图片
$url = 'http://bz.58.com/shouji/13230281617026x.shtml'; //58正文
$url='http://binzhou.baixing.com/shouji/a260560753.html'; //百姓网正文
$url='http://binzhou.baixing.com/shouji/a257953837.html'; //百姓网正文 带图
$url = 'http://www.chezhilv.cn/bencandy.php?fid-174-id-9117-page-1.htm'; //普通文章 带分页
$url='http://www.autohome.com.cn/news/201303/487381.html'; //文章 带分页
 

非常欢迎大家进行在线测试蓝锂智能正文获取系统,在线测试网址为:
https://www.lanelead.com/ZhiNengCaiJi.html

如果大家在测试中,发现识别不准确或者其他BUG,欢迎大家跟帖提出.
BUG反馈格式为:
网址
BUG说明
建议留下您的联系QQ,以便与您取得联系.

如果是有效反馈,蓝锂官方将提供 10锂币/条 奖励.
[备注:锂币是蓝锂网络使用的主要电子货币,可以进行有偿寻求技术帮助,可以下载收费软件,1锂币=1人民币,但普通会员不提供折现服务.] 
分享到QQ空间
分享到: 
Tags:采集 智能 正文识别 分页识别 自动 责任编辑:admin
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
销售咨询:
QQ: 1668142999
Email: 1668142999@qq.com
TEL: 13884867561
联系人:深蓝