新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML与各种文件格式的相互转换及相关工具。 word to xml, xml to word, html to xml, xml to pdf,
    csv to xml, rtf to xml, text to xml, xml to text, xls to xml, xml to xls
    FOP
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 WORD to XML, HTML to XML 』 → [原创]用java把word文档转换为htm文档 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 14130 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [原创]用java把word文档转换为htm文档 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     nobdy 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:-1
      积分:59
      门派:XML.ORG.CN
      注册:2004/10/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给nobdy发送一个短消息 把nobdy加入好友 查看nobdy的个人资料 搜索nobdy在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看nobdy的博客楼主
    发贴心情 [原创]用java把word文档转换为htm文档


    我这两天试着用java把word文档转换为htm文档,现已搞定,经验如下:

    1.下载jacob_18.zip:打开网址:http://sourceforge.net/projects/jacob-project/,然后点击[View ALL Project Files] ,里面有jacob的1.8版本下载;

    2.解压jacob_18.zip,将jacob.jar放在“JAVA_HOME\jre\lib\ext\”目录下(“JAVA_HOME”为你所安装的JDK目录),例如“C:\java\jre\lib\ext\”,将jacob.dll放在目录“C:\jacob\”下;

    3.设置path:右击“我的电脑” --> 选择“高级” --> 点击“环境变量” --> 在“系统变量”中双击变量“path”,在后边加上“C:\jacob;”,点击“确定”;

    4.编写程序(文件名为WordToHtm.java):
    /**
    * File Name : WordToHtm
    * Author :
    * Date : 2005.4.26
    * Note : convert word file to htm file.
    */

    import java.io.File;
    import com.jacob.com.*;
    import com.jacob.activeX.*;

    public class WordToHtm
    {
     public static void main( String[] args )
     {
      //启动word
      ActiveXComponent app = new ActiveXComponent( "Word.Application" );
      
      //要转换的word文件
      String inFile = "D:\\test\\my.doc";
      
      //目标文件
      String tpFile = "D:\\test\\my.htm";
      
      boolean flag = false;
      
      try
      {
       //设置word不可见
       app.setProperty( "Visible", new Variant(false) );
       
       Object docs = app.getProperty( "Documents" ).toDispatch();
       
       //打开word文件
       Object doc = Dispatch.invoke(
        docs ,
        "Open" ,
        Dispatch.Method ,
        new Object[]
        {
         inFile ,
         new Variant(false) ,
         new Variant(true)
        } ,
        new int[1]
              ).toDispatch();
       
       //作为html格式保存到临时文件
       Dispatch.invoke(
        doc ,
        "SaveAs" ,
        Dispatch.Method ,
        new Object[]
        {
         tpFile,new Variant( 8 )
        } ,
        new int[1]
             );
       
       Variant f = new Variant( false );
       Dispatch.call( doc , "Close" , f );
       flag = true;
      }
      catch( Exception e )
      {
       e.printStackTrace();
      }
      finally
      {
       app.invoke( "Quit" , new Variant[]{} );
      }
     }
    }

    5.将word文件my.doc放置在“D:\test\”目录下;

    6.编译WordToHtm.java并运行后,你就会发现在“D:\test\”目录下出现了my.htm文件。

    附注

    1.我使用的操作系统是windowXP,其它的系统我没有试过;

    2.我使用的word的版本是microsoft @ word 2002,如果是更新的版本有可能会不成功(这我也没试过);

    3.我所使用的jacob的版本是1.8,如果使用1.7或1.6版本则会出错,使用1.9版本也不行,编译不会成功,也许是因为1.9还处于开发阶段,尚不完善。


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/26 15:59:00
     
     jjplion 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:15
      积分:116
      门派:XML.ORG.CN
      注册:2005/4/11

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jjplion发送一个短消息 把jjplion加入好友 查看jjplion的个人资料 搜索jjplion在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jjplion的博客2
    发贴心情 
    好像就是实现了word的Save as的功能,呵呵
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/27 1:59:00
     
     cxh0926 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:20
      积分:136
      门派:XML.ORG.CN
      注册:2005/3/11

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给cxh0926发送一个短消息 把cxh0926加入好友 查看cxh0926的个人资料 搜索cxh0926在『 WORD to XML, HTML to XML 』的所有贴子 引用回复这个贴子 回复这个贴子 查看cxh0926的博客3
    发贴心情 
    顶起。希望高手来解决下,我也正要问的!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/5/5 22:18:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 WORD to XML, HTML to XML 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 8:34:13

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    70.313ms