天行数据增加网页转API功能

通过本功能可将任何HTML网页转为格式化API输出,方便制作自己的文章列表页,给自己的App/微信公众号/小程序等作为数据接口调用。匹配规则为DIV结构的CLASS或ID,系统自动读取标签内的对应内容。
 
以凤凰网新闻为例(http://news.ifeng.com/mainland/index.shtml):

搜狗截图20190107073029.jpg

 
Ctrl+U或右键查看网页源代码,找到如下DIV结构:

22.jpg

 
链接匹配规则:.juti_list h3 a
概要匹配规则:.juti_list .clearfix p
封面匹配规则:.juti_list .clearfix .ju_pic img
时间匹配规则:.juti_list .clearfix .ping03 span
 
即可成功获取并转化该网页列表为JSON数据如下图所示。完成后需审核通过才可以调用接口,与天行数据图文类接口返回结构和调用方式一致。如何你始终无法转化网页,请联系我付费30元代写转化规则(只需提交必填项*)。


webtojson.png

 
自定义数据接口的调用方式如下:
请求地址:api.tianapi.com/usermake/?key=APIKEY&urlid=1
key为必填参数,参数值为个人中心的apikey。urlid为必填参数,参数值为你在转换列表中对应的ID,num为可填参数,默认为10。另外,该接口的增加了一个可选的docid参数,当docid参数设为对应的链接ID时,则返回该对应链接下的完整文本内容。其他参数与天行数据图文类接口一致,具体请查看相关接口文档。
 
由于该服务需要大量消耗服务资源,所以按天收费,1000天行币/1个/天,系统自动从账户中预先扣取当天费用。如不使用,可随时停止避免扣费。停止后接口仍然可以照常调用,只是系统不会在自动采集数据。另外,普通用户最多只可以添加5个采集地址,高级会员暂无限制。

 提交成功后,我会第一时间收到审核请求。审核通过后,系统也会发提醒邮件给你。
 
如果你需要抓取的数据生成API后只有自己可以调用,则可以申请成为私有API。需要另行收费,价格为500元/年,附赠同服务期内高级会员服务。

自动采集功能有三种状态,分别如下图所示:
微信截图_20190301013610.png

红色为用户停止了采集,绿色为正在采集,黑色为正在审核或未审核通过。

0 个评论

要回复文章请先登录注册