版块导航
正在加载中...
客户端APP下载
论文辅导
申博辅导
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(2443)
>
虫友互识
(219)
>
休闲灌水
(47)
>
考研
(38)
>
导师招生
(37)
>
硕博家园
(36)
>
论文道贺祈福
(34)
>
文献求助
(33)
>
公派出国
(31)
>
教师之家
(25)
>
基金申请
(24)
>
考博
(23)
>
博后之家
(22)
>
论文投稿
(22)
>
找工作
(16)
>
招聘信息布告栏
(12)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
程序语言
»
Java
»
dom4j如何处理700M大小的xml文件
7
1/1
返回列表
查看: 1329 | 回复: 6
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
冰域逐梦
银虫
(初入文坛)
应助: 0
(幼儿园)
金币: 741
散金: 2
帖子: 41
在线: 7.4小时
虫号: 1744786
注册: 2012-04-08
性别: GG
专业: 生物信息学
[
求助
]
dom4j如何处理700M大小的xml文件
dom4j如何处理700M大小的xml文件,从pubmed上下载的XML文件,想把摘要部分提出来,但是程序运行之后内存就会溢出,用小一点的测试数据程序是可以正常运行的,求高手指点
回复此楼
» 猜你喜欢
请问哪里可以有青B申请的本子可以借鉴一下。
已经有4人回复
真诚求助:手里的省社科项目结项要求主持人一篇中文核心,有什么渠道能发核心吗
已经有6人回复
孩子确诊有中度注意力缺陷
已经有14人回复
三甲基碘化亚砜的氧化反应
已经有4人回复
请问下大家为什么这个铃木偶联几乎不反应呢
已经有5人回复
请问有评职称,把科研教学业绩算分排序的高校吗
已经有5人回复
2025冷门绝学什么时候出结果
已经有3人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
AI论文写作工具:是科研加速器还是学术作弊器?
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
请大家来讨论:水处理中涉及到电力的设备有哪些
已经有12人回复
球形二氧化硅的合成粒径大小
已经有19人回复
混凝剂处理垃圾渗滤液,出现不了上清液,没法测cod,咋办?
已经有23人回复
我在跑胶时的DNA片段大小为什么与测序后的相差很大呢???求大侠指导!
已经有13人回复
生物质吸附剂吸附重金属离子后,应该怎么处理?
已经有17人回复
急求教:p4vasp 打开xml文件时 提示 error reading property NAME
已经有14人回复
FLUENT后处理问题
已经有3人回复
【求助】进口药品临床研究如何做
已经有11人回复
【求助】(人形识别中)用来标注avi视频中每帧信息的xml文件如何使用
已经有3人回复
【求助】Fortran 如何读取文件中特定行的内容
已经有16人回复
冰域逐梦
1楼
2012-05-01 21:05:05
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
youxikun
银虫
(初入文坛)
应助: 1
(幼儿园)
金币: 329.7
帖子: 17
在线: 4小时
虫号: 606516
注册: 2008-09-18
性别: GG
专业: 工业工程与管理
【答案】应助回帖
★
感谢参与,应助指数 +1
xzhdty: 金币+1, 欢迎常来程序语言看看
2012-05-02 06:42:10
没搞过这么大的文件,仅仅提供个想法。
修改dom4j源码,分段读取文件或者用内存映射。
不知道可行不
赞
一下
回复此楼
2楼
2012-05-02 00:46:58
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
sein_tao
金虫
(小有名气)
应助: 5
(幼儿园)
金币: 648.6
帖子: 54
在线: 18.9小时
虫号: 988167
注册: 2010-04-03
专业: 生物信息学
【答案】应助回帖
感谢参与,应助指数 +1
调一下JVM的内存大小试试看。
很大的文件的话还是自己按流的方式去处理吧。不要一次读到内存中。
赞
一下
回复此楼
3楼
2012-05-06 00:01:41
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
sein_tao
金虫
(小有名气)
应助: 5
(幼儿园)
金币: 648.6
帖子: 54
在线: 18.9小时
虫号: 988167
注册: 2010-04-03
专业: 生物信息学
【答案】应助回帖
★
xzhdty: 金币+1, 欢迎常来
2012-05-06 06:42:59
补充:
参考
http://stackoverflow.com/questio ... e-xml-files-in-perl
赞
一下
回复此楼
4楼
2012-05-06 00:09:00
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
wizardfan
至尊木虫
(著名写手)
应助: 599
(博士)
贵宾: 1.818
金币: 24624.2
散金: 197
红花: 48
沙发: 2
帖子: 2254
在线: 400.7小时
虫号: 1879241
注册: 2012-07-05
性别: GG
专业: 生物信息学
【答案】应助回帖
1. java -Xms1024m -Xmx1024m AppName 把内存设置搞大点就行了。
2. 还有如果有些object不用了的话, 设为null,并运行gc()
3. 用基于jaxb的类库,那个对内存要求很小
赞
一下
回复此楼
5楼
2012-07-13 03:14:15
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
笨猫的项圈
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 23.5
帖子: 8
在线: 2.9小时
虫号: 1818567
注册: 2012-05-15
专业: 计算机软件
XML的解析方式:
1.DOM(Document Object Model 文档对象模型)
关键字:树(Document)
优点: 把xml文件在内存中构造树形结构,可以遍历和修改节点
缺点: 如果文件比较大,内存有压力,解析的时间会比较长
2. SAX(Simple API for Xml 基于XML的简单API)
关键字:流(Stream)
把xml文件作为输入流,触发标记开始,内容开始,标记结束等动作
优点: 解析可以立即开始,速度快,没有内存压力
缺点: 不能对节点做修改
后者触发式解析是不是符合你的要求?
赞
一下
(1人)
回复此楼
6楼
2012-08-13 11:47:54
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
uniqak47
铜虫
(初入文坛)
应助: 0
(幼儿园)
金币: 4135.8
帖子: 32
在线: 3.1小时
虫号: 1991726
注册: 2012-09-11
性别: GG
专业: 中国古代文学
【答案】应助回帖
5楼正解。
SAX适合对大型xml等结构化文件进行操作,自己做好标记控制就行,不需要在内存中构造全部树结构
赞
一下
回复此楼
好好学英语
7楼
2012-10-30 09:15:33
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
相关版块跳转
第一性原理
量子化学
计算模拟
分子模拟
仿真模拟
程序语言
我要订阅楼主
冰域逐梦
的主题更新
7
1/1
返回列表
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定