php 采集并合成txt格式文件功能实例
内容摘要
这篇文章主要为大家详细介绍了php 采集并合成txt格式文件功能实例,具有一定的参考价值,可以用来参考一下。
对php 采集并合成txt格式对此感兴趣的朋友,看看idc笔记做的技术笔
对php 采集并合成txt格式对此感兴趣的朋友,看看idc笔记做的技术笔
文章正文
这篇文章主要为大家详细介绍了php 采集并合成txt格式文件功能实例,具有一定的参考价值,可以用来参考一下。
对php 采集并合成txt格式对此感兴趣的朋友,看看idc笔记做的技术笔记!1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 | <code class = "php" > /** * php 采集并合成txt格式 * * @param * @arrange 512-笔记网: 512pic.com **/ <?php /** * @name 采集书.php * @date Sun Mar 01 22:48:02 CST 2009 * @copyright 马永占(MyZ) * @author 马永占(MyZ) */ //header('Content-Type:text/html;charset=utf8'); header( 'Content-Type:text/html;charset=gb2312' ); error_reporting (E_ALL); date_default_timezone_set( 'Asia/Shanghai' ); set_time_limit(0); function writer( $content , $url ) { $fp = fopen ( $url , 'ab' ); fwrite( $fp , $content ); fclose( $fp ); } $folder = '2' ; //文件夹 $book_base_url = 'xxxxxxxxxxxxxxxxxxxxx' ; $book_url = 'yyyyyyyyyyyyy.html' ; $main = file_get_contents ( $book_base_url . $book_url ); preg_match_all( '/chapter_.*?\.html/' , $main , $pages ); $pages = array_unique ( $pages [0]); foreach ( $pages as $value ) { writer( file_get_contents ( $book_base_url . $value ), './' . $folder . '/' . $value . '.txt' ); $str = file_get_contents ( './' . $folder . '/' . $value . '.txt' ); //print_r($str); preg_match( "/(<h1>)(.*?)(<\/h1>)(.*?)(<div id=\"contTxt\" class=\"contTxt1\">)(.*?)(<\/div>)/s" , $str , $arr ); //print_r($arr);die(); $arr [6] = preg_replace( "/(<span[^>]+>.*?<a[^>]+>)(.*?)(<\/a><\/span>)/s" , "$2" ,preg_replace( "/<p>|<\/p>/" , "\r\n" , $arr [6])); $result = "\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n----------------" . $arr [2]. "\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n" . $arr [6]; writer( $result , './' . $folder . '/new.txt' ); } ?> /*** 来自php教程(www.idcnote.com) ***/ </code> |
注:关于php 采集并合成txt格式文件功能实例的内容就先介绍到这里,更多相关文章的可以留意
代码注释