dedecms织梦内容管理系统    
首页 | java | C/C++ | PHP | 操作系统 | ajax | 脚本编程 | 安全技术 | 本站下载页 | flex | CRM | 专题 | QQ群 | 测试中心 | 会员中心 | 积分规则
  当前位置:主页>PHP>php技术资料>文章内容
用php5的simplexml解析各种feed
来源:喜悦村国际 作者:
用simplexml处理atom数据
很多博客使用atom来输出数据,但是atom使用了名称空间(namespace),所以现在请求被命名的元素和本地名称时必须指定名称空间统一资源标识符(URI),还有一点就是simplexml的xpath方法无法直接query这个xml tree。

从 PHP 5.1 版开始,SimpleXML 可以直接对带名称空间的文档使用 XPath 查询。和通常一样,XPath 位置路径必须使用名称空间前缀,即使搜索的文档使用默认名称空间也仍然如此。registerXPathNamespace() 函数把前缀和后续查询中使用的名称空间 URL 联系在一起。

下面是使用xpath查询atom文档title元素的例子:

PLAIN TEXT
CODE:
$atom = simplexml_load_file(‘http://www.ooso.net/index.php/feed/atom‘);
$atom->registerXPathNamespace(‘atom‘, ‘http://www.w3.org/2005/Atom‘);
$titles = $atom->xpath(‘//atom:title‘);
foreach ($titles as $title)
echo "

" . $title . "

";
用simplexml处理rss数据
wordpress可以输出rss2的数据源,这里面也有一些不同的namespace,比如dc。一个使用simplexml解析rss2的例子:



PLAIN TEXT
PHP:
$ns = array (
‘content‘ => ‘http://purl.org/rss/1.0/modules/content/‘,
‘wfw‘ => ‘http://wellformedweb.org/CommentAPI/‘,
‘dc‘ => ‘http://purl.org/dc/elements/1.1/
);

$articles = array();

// step 1: 获得feed
$blogUrl = ‘http://www.ooso.net/index.php/feed/rss2‘;
$xml = simplexml_load_url($blogUrl);

// step 2: 获得channel metadata
$channel = array();
$channel[‘title‘] = $xml->channel->title;
$channel[‘link‘] = $xml->channel->link;
$channel[‘description‘] = $xml->channel->description;
$channel[‘pubDate‘] = $xml->pubDate;
$channel[‘timestamp‘] = strtotime($xml->pubDate);
$channel[‘generator‘] = $xml->generator;
$channel[‘language‘] = $xml->language;

// step 3: 获得articles
foreach ($xml->channel->item as $item) {
$article = array();
$article[‘channel‘] = $blog;
$article[‘title‘] = $item->title;
$article[‘link‘] = $item->link;
$article[‘comments‘] = $item->comments;
$article[‘pubDate‘] = $item->pubDate;
$article[‘timestamp‘] = strtotime($item->pubDate);
$article[‘description‘] = (string) trim($item->description);
$article[‘isPermaLink‘] = $item->guid[‘isPermaLink‘];

// get data held in namespaces
$content = $item->children($ns[‘content‘]);
$dc = $item->children($ns[‘dc‘]);
$wfw = $item->children($ns[‘wfw‘]);

$article[‘creator‘] = (string) $dc->creator;
foreach ($dc->subject as $subject)
$article[‘subject‘][] = (string)$subject;

$article[‘content‘] = (string)trim($content->encoded);
$article[‘commentRss‘] = $wfw->commentRss;

// add this article to the list
$articles[$article[‘timestamp‘]] = $article;
}
这个例子中,使用children方法来获得名称空间中的数据:

PLAIN TEXT
PHP:
$dc = $item->children($ns[‘dc‘]);

上一篇:JAVA基础:将数据库操作封装到Javabean   下一篇:apachectl - Apache HTTP服务器控制接口
[收藏] [推荐] [评论(0条)] [返回顶部] [打印本页] [关闭窗口]  
用户名: 新注册) 密码: 匿名评论
评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
 §最新评论
  热点文章
·通过对PHP服务器端特性的配置加
·php与mysql三日通
·AJAX技术在PHP开发中的简单应用
·大家所使用的PHP开发环境
·PHP缓存的实现
·针对PHP新手总结的PHP基础知识
·一个简单实现多条件查询的例子
·PHP串行化变量和序列化对象
·PHP表单
·推荐阅读:php技术生成静态页面
·php实用函数
·php生成随机数
  相关文章
·php的缓存类
·生成静态页面的PHP类
·什么时候用GET?什么时候用POST
·缺陷月项目披露PHP脚本语言漏洞
·PHP 命令行?是的,您可以!
·Apache服务器配置全攻略
·挑战最棒的留言本的源码(二)
·挑战最棒的留言本的源码(一)
·用php与mysql的电子贺卡程序
·用PHP调用数据库的存贮过程
·浅谈Windows下 PHP4.0与oracle 8
·用PHP连mysql和oracle数据库性能
  相关信息
copy right @ 百家拳软件项目研究室 2007 辽ICP备07011763