PHP要访问和解析HTML的DOM在操作上比较繁琐,而SIMPLE HTML DOM是一个为PHP写的一个HTML DOM解析器让我们更快的获取与操作到微信公众号文章的关键数据。
[官网地址] && [使用手册]
流程
- 加载
SIMPLE_HTML_DOM
模块
- 找到公众号
标题
、作者
以及文章内容
的特殊标识符或id
- 调用模块取得去格式化内容
- 输出内容
代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
| <?php
include_once 'simple_html_dom.php'; header("Content-Type: text/html; charset=UTF-8");
$url='http://mp.weixin.qq.com/s?__biz=MjM5NzAwNzMyMA==&mid=411484321&idx=1&sn=45bb6726d1fb9cd4d06dc86a52649b42&scene=4#wechat_redirect '; $html=file_get_html($url);
$articleTitle=$html->find("#activity-name",0)->plaintext; echo $articleTitle;
echo "<br><span style='color: red'>公众号作者:</span>";
$articleAuthor=$html->find("#post-user",0)->plaintext; echo $articleAuthor."<br>";
$pageContent=$html->find('#js_content span'); foreach ($pageContent as $value){ echo $value->plaintext; }
$html->clear();
|
OneMoreThing
微信公众号文章里的投票模块
是直接使用iframe嵌入到其中,SIMPLE_HTML_DOM对此无能(可能是我才学粗浅,但是我测试用简单的代码应用是做不到的)。