新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML与各种文件格式的相互转换及相关工具。 word to xml, xml to word, html to xml, xml to pdf,
    csv to xml, rtf to xml, text to xml, xml to text, xls to xml, xml to xls
    FOP
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 WORD to XML, HTML to XML 』 → Office 2003 Word to XML to HTML Example 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 14481 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: Office 2003 Word to XML to HTML Example 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 WORD to XML, HTML to XML 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 Office 2003 Word to XML to HTML Example

    -- 10/13/03
    I've been looking at [URL=http://www.w3.org/XML/]XML[/URL] files created from [URL=http://www.microsoft.com/office/preview/editions/technologies/xml.asp]Office 2003 Word[/URL] and rendering them to [URL=http://www.w3.org/MarkUp/]HTML[/URL] via [URL=http://www.w3.org/TR/xslt]XSLT[/URL] using the [URL=http://www.java.sun.com/]Java[/URL] classes described on my page, [URL=http://www.timeoutofmind.com/xmlCodeExamples/xmlTreeViewer.cfm]XML Tree Viewer[/URL].

    Microsoft sure adds a lot of extra (unnecessary?) data inside the xml version of those documents. My test ".doc" in its standard document format is only 24k in size; the ".xml" version is 20k. When I render the xml into a tree displayed as a html table, the redundant namespace information for each of the document's elements causes the expansion to be 1.4MB in size! Another author [URL=http://www.infoworld.com/article/03/10/03/39FEofficerev_1.html]has also discovered[/URL] this same bloated structure.

    I wonder if Microsoft's intention is to force corporations to buy expensive content management systems to deal with the bloat? It seems to me that the [URL=http://www.w3schools.com/dtd/default.asp]DTD[/URL] or [URL=http://www.w3.org/XML/Schema]XML Schema[/URL] Microsoft is using could be simplified to export to xml only the required support for the actual document and not every feature that Word can support.

    You can look at the actual files I used in this discussion by downloading the ".zip" compressed file, [URL=http://www.timeoutofmind.com/code_examples/xml/word_to_xml_to_html.zip]Office 2003 Word to XML to HTML Example Code[/URL].

    After uncompressing that file, you'll have a folder containing a Word document, that same Word document saved as ".xml", and an html rendering of that ".xml" file.


       收藏   分享  
    顶(1)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/2/23 23:43:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 WORD to XML, HTML to XML 』的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 10:37:47

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    27.344ms