以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 WORD to XML, HTML to XML 』  (http://bbs.xml.org.cn/list.asp?boardid=13)
----  请教大家如何用vb将word文件转换成xml文件呢?  (http://bbs.xml.org.cn/dispbbs.asp?boardid=13&rootid=&id=31192)


--  作者:hero5180
--  发布时间:4/24/2006 6:56:00 PM

--  请教大家如何用vb将word文件转换成xml文件呢?
具体要求如下:

1. 目标

将一定格式的 word 文件转换成一定格式的 xml 文件,该 xml 文件可以用 XSLT 显示成 html 格式。

  

2. 源文件

在 source 目录下,有多个 word 文件,文件名为源文件 -x.doc

每个文件的格式都是相同的,包括多个以下的两类内容:

<INFO_X>

This is the content of INFO_X.

  

<ID_X>

This is the content of ID_X.

  

要求把文件转换成 xml 格式。在 xml 文件里,要求转换成相应的

<INFO_X>

       This is the content of ID_X with html format.

</INFO_X>

  

<ID_X>

       <HTML>

              This is the content of ID_X with html format.

       </HTML>

</ID_X>

  

对 <INFO> 中的内容,不需要保存格式。对 <ID_X> 中的内容,要保存 HTML 格式。在 word 格式里,可能包含有图像文件或其他的对象。

  

3. 目标文件

在 source 目录下,建立相应的 xml 文件,文件名为源文件 -x.doc.xml


在 xml 文件中,第一行应为

<?xml  version="1.0"?>
其余的内容对应 word 文件的内容。对于源文件中的图像和公式等对象,可以用 html 的 <img> 标识指向子目录下的图形文件。

在 <html></html> 之间,不能含有 <head></head> 标识,只能有 <body></body> 的内容。在 <body></body> 内,需要将 html 的格式保存下来。

  

4 . XSLT 文件

生成一个 XSLT 文件,将目标文件在 IE 浏览器内显示,其中不显示 <INFO_X>  标识和内容,以及 <ID_X> 的标识。

  
希望大家能够帮我看看~!


--  作者:hero5180
--  发布时间:4/27/2006 12:17:00 PM

--  
怎么无人问津列
--  作者:hero5180
--  发布时间:4/27/2006 12:55:00 PM

--  
怎么用vb将word文件直接生成html文件,然后再将html文件转换成相应的xml文件和XSLT文件呢?
--  作者:ludahai
--  发布时间:6/26/2006 10:29:00 AM

--  
vb.net,用xmldocument类
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
45.898ms