基于PHP读取TXT文件向数据库导入海量数据的方法

添加时间:13-07-26 所属分类:PHP工具与代码
  转载自http://www.im286.com/thread-11393711-1-1.html

有一个TXT文件,包含了10万条记录,格式如下:
列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
……………………后面有10万条………………
需求是要导入数据库中,数据表的结构为
word_id 自动增量
word 【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录
value =第三列-第四列;如果=0,则此条记录略过不插入数据表

代码如下:
[code]<?php

$file = 'words.txt';//10W条记录的TXT源文件

$lines = file_get_contents($file);

ini_set('memory_limit', '-1');//不要限制Mem大小,否则会报错

$line=explode("\n",$lines);

$i=0;

$sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";



foreach($line as $key =>$li)

{

$arr=explode(" ",$li);

$senti_value=$arr[2]-$arr[3];

if($senti_value!=0)

{

if($i>=20000&&$i<25000)//分批次导入,避免失败

{

$mm=explode(" ",$arr[4]);

foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录 {

$nn=explode("#",$m);

$word=$nn[0];

$sql.="(\"$word\",1,$senti_value,2),";//这个地方要注意到是 word有可能包含单引号(如jack's),因此我们要用双引号来包含word(注意转义)

}

}

$i++;

}

}

//echo $i;

$sql=substr($sql,0,-1);//去掉最后一个逗号

//echo $sql;

file_put_contents('20000-25000.txt', $sql); //批量导入数据库,5000条一次,大概需要40秒的样子;一次导入太多max_execution_time会不够,导致失败

?>[/code]
复制代码1,海量数据导入到时候,要注意PHP的一些限制,可以临时调整一下,否则会报错

Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)
2,PHP操作TXT文件
file_get_contents()
file_put_contents()
3,海量导入的时候,最好分批次导入,失败的几率小一些
4,海量导入之前,脚本一定要多次测试无误再使用,比如用100条数据来测试
5,导入之后,如果PHP的mem_limit还是不够的话,程序仍然跑不起来
(建议用修改php.ini的方式来提高mem_limit,而不是用临时的语句)找影音整理(www.zhaoyingyin.com)

前篇:武汉一小贩练摊7年逆袭当城管 常被认成“卧... 后篇:15名大学生在济生存体验 赚来1850元不翼而飞
发表我的评论


推荐文章   四川乐山84岁老太和儿子骑摩托去西藏,...   失去乳房与癌共处,33岁王晨岑:镜头下...   城市里的“船上人”:年均六旬 日捞数吨...   毕业后,我学习过贫穷北漂日子   创城路上 “唐冶大妈”亮了
随机文章   php读取某目录下的所有同类型文件   PHP乱码问题,UTF-8(乱码),很全的说...   PHP处理SQL脚本文件导入到MySQL的代码实...   Php+Ajax实现翻页效果   PHP中 ajax中get与post的区别
广告

其他推荐

因为本站所有内容均转载自其它媒体,本意为公众提供免费服务,但并不代表本网赞同其观点,也不能对其真实性验证负责,如稿件版权单位或个人不想在本网发布,请与我联系,本人会立即将其撤除,谢谢.联系方式:atseashawk@163.com QQ:99289555