以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 DTD/XML Schema 』  (http://bbs.xml.org.cn/list.asp?boardid=23)
----  这样的xml文件如何创建  (http://bbs.xml.org.cn/dispbbs.asp?boardid=23&rootid=&id=43498)


--  作者:yoyota
--  发布时间:3/1/2007 8:58:00 AM

--  这样的xml文件如何创建

请问有什么较直接的方法把下面的sgml格式转成要求的xml文档格式吗?
原文档格式是如下的sgml格式:
<DOC>
  <DOCID> nyt960108.0493 </DOCID>
  <STORYID cat=a pri=u> A5852 </STORYID>
  <SLUG fv=sci-z> BC-BALLOON-RACE-2ndTAKE- </SLUG>
  <DATE> 01-08 </DATE>
  <NWORDS> 0745 </NWORDS>
  <PREAMBLE>  BC-BALLOON-RACE-2ndTAKE-NYT  UNDATED: daylight hours.  </PREAMBLE>
  <TEXT>
    <p>      ......
    <p>      ......
  </TEXT>
  <TRAILER>  NYT-01-08-96 1751EST  </TRAILER>
</DOC>
<DOC>
  ......
</DOC>

现在想把这种格式转换成如下xml格式, 即给原来的元素属性加引号,另外给<TEXT>中标签<P>加</P>,使之成为完整的xml文档如下:
<DOC>
  <DOCID> nyt960108.0493 </DOCID>
  <STORYID cat="a" pri="u"> A5852 </STORYID>
  <SLUG fv="sci-z"> BC-BALLOON-RACE-2ndTAKE- </SLUG>
  <DATE> 01-08 </DATE>
  <NWORDS> 0745 </NWORDS>
  <PREAMBLE>  BC-BALLOON-RACE-2ndTAKE-NYT  UNDATED: daylight hours.  </PREAMBLE>
  <TEXT>
    <p>      ......
    <p>      ......
  </TEXT>
  <TRAILER>  NYT-01-08-96 1751EST  </TRAILER>
</DOC>

因为我对XML不熟悉,只能通过直接读取字符串再比较的方法进行,不知有什么好方法可以方便转化,最好还能够适应标签的变化,比如<TEXT>中的<P>换成了<SENTENCE>, 有没有什么工具或模版之类的可以直接修改的?
谢谢!


--  作者:flyfoxs
--  发布时间:3/6/2007 8:20:00 PM

--  
使用XSL,它是专门干活这个的。可以完全满足你的需求,不过学习曲线有点陡。
--  作者:zhy_justin
--  发布时间:3/16/2007 11:58:00 AM

--  
学习中
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
31.250ms