-
基于Snoopy的PHP近似完美获取网站编码的代码
本文是一个基于Snoopy的PHP近似完美获取网站编码 用于php爬虫,获取编码准确率99.9%, 还有部分不能获取,感兴趣的同学参考下。 先要到网上下载Snoopy.class.php 调用方法: <?php require 'lib/Snoopy.class.php'; require 'lib/WebCrawl.class.php';//包含下面代码 $go=new WebCrawl('http://www.baidu.com'); echo $go->getCharset(); ?> <?php class WebCrawl { private $url; private $request; public $charset_arr=array( 'gb2312', 'utf-8', 'big5', 'gbk', 'ascii', 'cp936', ...
PHP 2014-12-24 22:09:06 -
PHP采集类snoopy详细介绍
本文为大家讲解的是PHP采集类snoopy详细介绍,Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单,可以用来开发一些采集程序和小偷程序,本文章详细介绍snoopy的使用教程。 Snoopy的一些特点: 抓取网页的内容 fetch 抓取网页的文本内容 (去除HTML标签) fetchtext 抓取网页的链接,表单 fetchlinks fetchform 支持代理主机 支持基本的用户名/密码验证 支持设置 user_agent, referer(来路), cookies 和 header content(头文件) 支持浏览器重定向,并能控制重定向深度 能把网页中的链接扩展成高质量的url(默认) 提交数据并且获取返回值 支持跟踪HTML框架 支持重定向的时候传递cookies 要求php4以上就可以了 由于本身是php一个类 无需扩支持 服务器不支持curl时候的最好选择, Snoopy类方法及示例: fetch($URI) 这是为了抓取网页的内容而使用的方法...
PHP 2014-12-21 07:27:03 -
php使用Snoopy进行数据采集的方法详解
本文为大家讲解的是php使用Snoopy进行数据采集的方法详解,感兴趣的同学参考下。 这里介绍两个php采集能用到的好工具...
PHP 2014-12-21 03:21:04 -
PHP 之 写时复制介绍(Copy On Write)
本文为大家讲解的是PHP 之 写时复制介绍(Copy On Write),感兴趣的同学参考下。 很多时候,我们会因为一些术语而对其概念产生莫测高深的恐惧,而其实,他们的基本原理往往非常简单...
PHP 2014-12-19 17:33:04 -
PHP图片处理之使用imagecopy函数添加图片水印实例讲解
本文向大家讲解的是PHP图片处理之使用imagecopy函数添加图片水印实例,给出了一个简单的入门级的自定义函数示例,需要的朋友可以参考下 为图片添加水印也是图片处理中常见的功能。因为只要在页面中见到的图片都可以很轻松地拿到,你辛辛苦苦编辑的图片不想被别人不费吹灰之力拿走就用,所以为图片添加水印以确定版权,防止图片被盗用...
PHP 2014-12-17 15:18:05 -
YY语音将收购教育机构 K12细分领域被看好
每经记者 孟庆建 发自深圳今年2月宣布投入10亿元进军在线教育领域的YY语音,近日被传将重金收购国内教育机构进行K12(“K12”是指从幼儿园到12年级的教育)市场布局。12月6日,《每日经济新闻》记者在YY语音相关负责人处确认了此消息,该负责人称收购十分顺利,方案近日将公布,并表示“不会让市场等太久”...
互联网 2014-12-08 04:54:06 -
snoopy 强大的PHP采集类使用实例代码
本文为大家讲解的是snoopy PHP采集类使用实例代码,感兴趣的同学参考下。 Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单...
PHP 2014-12-07 15:54:04 -
PHP采集利器 Snoopy 试用心得
本文以示例的方式为大家讲解的是PHP采集利器 Snoopy 试用心得,感兴趣的同学参考下。 Snoopy是什么? (下载snoopy) Snoopy是一个php类,用来模仿web浏览器的功能,它能完成获取网页内容和发送表单的任务...
PHP 2014-12-07 07:15:03 -
python操作MySQL数据库的方法
本文为大家讲解的是一个python操作MySQL数据库的方法,采用的是MySQLdb操作的MYSQL数据库。感兴趣的同学参考下. import MySQLdb try: conn=MySQLdb.connect(host='localhost',user='root',passwd='root',db='test',port=3306) cur=conn.cursor() cur.execute('select * from user') cur.close() conn.close() except MySQLdb.Error,e: print "Mysql Error %d: %s" % (e.args[0], e.args[1]) 请注意修改你的数据库,主机名,用户名,密码...
数据库操作教程 2014-11-30 04:02:10 -
python结合mysql实现的简单队列以及跨进程锁实例代码
本文是一个python结合mysql实现的简单队列以及跨进程锁的示例代码,感兴趣的朋友可以参考下 通常在我们进行多进程应用开发的过程中,不可避免的会遇到多个进程访问同一个资源(临界资源)的状况,这时候必须通过加一个全局性的锁,来实现资源的同步访问(即:同一时间里只能有一个进程访问资源)。 举个例子如下: 假设我们用mysql来实现一个任务队列,实现的过程如下: 1. 在Mysql中创建Job表,用于储存队列任务,如下: create table jobs( id auto_increment not null primary key, message text not null, job_status not null default 0 ); message 用来存储任务信息,job_status用来标识任务状态,假设只有两种状态,0:在队列中, 1:已出队列 2. 有一个生产者进程,往job表中放新的数据,进行排队: insert into jobs(messag...
数据库操作教程 2014-11-30 01:35:48 -
大吐槽:那些爱YY的PM做出的“智能”产品
站长搜索(www.adminso.com):大吐槽:那些爱YY的PM做出的“智能”产品 现有的技术,足够给逗比的产品经理无数次秀下限的机会,人们当然没有必要为此买单。科技是用来享受生活,而不是为了感受科技本身,如果产品带着反人类的标签来到这个世界,博人一笑还无伤大雅,愚弄大众那就无耻至极了...
业界动态 2014-11-29 14:59:51 -
使用python将mdb数据库文件导入postgresql数据库示例
本文是一个python实现的可以将mdb数据库文件导入到postgresql数据库的示例代码,非常实现的一个功能,感兴趣的同学参考下. mdb格式文件可以通过mdbtools工具将内中包含的每张表导出到csv格式文件。由于access数据库和postgresQL数据库格式上会存在不通性,所以使用python的文件处理,将所得csv文件修改成正确、能识别的格式 导入脚本说明(此脚本运行于linux): 1.apt-get install mdbtools,安装mdbtools工具 2.将mdb 文件拷贝到linux虚拟机中,修改脚本中mdb文件目录‘dir' 3.修改服务器及数据库配置 4.执行脚本 # -*- encoding: utf-8 -*- import os import re import psycopg2 import csv #mdb文件目录 dir = r'/home/kotaimen/mdb_file/' mdb_tbl_dic =...
PHP 2014-11-29 11:11:14