原文:
应用场景:
a.我在做BI开发测试的时候,有可能面对source文件数GB的情况,如果使用一般的文本编辑器,则会卡死,或要等很久才能显示出来。
b.有时候,我们使用ascii(01)或ascii(02)作为行或列的分隔符,这样的临时文件用于导数据到DB,如果文件导入过程中有错误,需要查看文件 的时候,普通的编辑器不支持换行,则会很恐怖。
为解决这两个需求,我使用c#完成了一个简单的winform的应用程序。
功能列表:
1.根据配置的行数,写测试文件,指定行终止符,列分隔符暂时没有使用上。
2根据指定的行终止符,和pagesize,分页读取文件内容,而且可以在text和byte间转换。
Sourcecode:
主要的代码如下,使用了一个迭代器:
private IEnumeratorReadLines(string filename){/*string line;using (TextReader reader = File.OpenText(filename)){while ((line = reader.ReadLine()) != null)yield return line;}*/StringBuilder sb = new StringBuilder();using (FileStream fs = File.OpenRead(filename)){int b = 0;while ((b=fs.ReadByte())!=-1){//textbox3 store the row terminatorif (b.ToString() == textBox3.Text.Trim()){yield return sb.ToString();sb.Clear();}elsesb.Append(UnicodeEncoding.ASCII.GetString(new byte[] { byte.Parse(b.ToString()) }));}}}
示例截图:
我测试了一次,生成了1个亿的数据行,在系统中显示占用6GB的空间,
我尝试读写,无卡顿情况。
可以进一步更新:
根据列行分隔符显示到gridview中,这样更清晰。
可以从后往前读文件。
posted on 2014-11-12 00:06 阅读( ...) 评论( ...)