以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 XML基础 』 (http://bbs.xml.org.cn/list.asp?boardid=1) ---- 把数据转换成XML格式的好处 (http://bbs.xml.org.cn/dispbbs.asp?boardid=1&rootid=&id=5423) |
-- 作者:小鞋子 -- 发布时间:2/19/2004 9:22:00 AM -- 把数据转换成XML格式的好处 我们常常会碰到需要处理以各种格式(从以逗号或者制表符做分隔符的文件到更负载的格式)保存或者传输的数据的情况,对每一种格式你都需要对应的解析器(parser)。这一缺点减缓了开发进度,而且可能会导致错误的发生。一个解决方案就是把常用格式的数据转化成XML文档,然后对它进行保存、处理或者转换成其它格式。 一个实例 现在已经有好多种实现在软件内部或者软件之间进行数据保存、导出、导入以及传输功能的数据格式。最常见的是定界格式(delimited format),如逗号或者制表符分隔数据格式以及定长数据格式。假设我们有一个地址簿程序,该程序提供把数据导出成逗号分隔以及固定长度这两种格式的功能。 在逗号分隔格式中,用逗号来分隔同一个数据记录中的不同字段,如清单A所示。而在固定长度数据格式中,记录的每一个字段都应该有一个标准长度。清单B给出了一个固定长度格式的地址簿。 现在,让我们解析输入数据并把它转换成XML文档。XML文档(即org.w3c.dom.Document)是全部文档对象模型(DOM)的原始数据类型,并且它提供了对文档数据的访问。 你可以用执行buildDocument(InputStream is)方法来创建与你的数据对应的文档,如代码清单C所示。该方法逐行读取输入数据流,并根据给定格进行来逐行分析。 如果你想解析分界格式数据,你需要创建构造函数为PlainTextToXmlFormatter(String[ ] colName,String delim)的类的实例,其分界符可以是任何字符串。在固定长度格式的情况下,你应该使用第二种构造函数PlainTextToXmlFormatter(String[ ] colName,int[ ] colLen),它的一个参数为字段长度数组。在我们所给的地址簿例子中,各字段的长度分别为10、10、30以及10个字符。参数colName是保存了目标数据记录的名字的数组,在我们给出的这个例子中,名字分别为名(firstName)、姓(lastName)、email以及电话号码(phone)。 把数据行转换为数据符号的实际解析过程也就是执行getStringArray(String read,String delim)或者parseFixedLengthMessage(String read,int[ ] colLen)方法的过程。其返回值是一个String型数组,这个数组是上述两个方法把给定输入进行分解而得来的。如果数据格式不对,就会抛出一个例外并且终止解析过错。调用setSkipError(true)方法就可以忽略例外并完成数据解析过程。调用这个方法可以防止抛出例外,但它仍允许程序向错误输出流打印错误信息。 当行被解析成标记后,它们作为XML文档的元素而加入到XML文档之中。放入到元素之中的每一行记录都有一个默认的名字line,你也可以调用setDataLineName()来指定名字。每一个数据记录都是一个列元素,列元素的名字由相应的类构造函数提供,子元素加到行元素之中。 在输入数据完全读取之后,你就得到了一个有效的XML文档,你可以进一步处理这个文档。现在,由于数据是按众所周知的树状结构来组织的,因此处理它非常简单。例如,你可以把这个文档送交给第三方,只要第三方知道该文档的文档类型定义(Document Type Definition ,DTD),那么他就可以很容易的处理文档了。你还可以调用writeDocument(Document doc,OutputStream osOut)方法来保存这个文档。代码清单D就给出一个把XML文档保存到一个文件中的例子。 你还可以把XML数据转换成其它格式,并用不同的视图来表示其内容。最简单的方法就是使用XSLT转换,它提供了一种强大的面向树的转换语言实现,可以把使用一种词汇表的XML实例转换成简单文本、HTML或者使用其它词汇表的XML。 对给定的XML输入,你可以用XSLT语言来创建你所期望的输出。例如,通过执行transformData(InputStream xmlIn,InputStream xslIn,OutputStream transfOut),你就可以把XML数据转换成一个HTML文档。代码清单E提供了XSLT转换的一个例子,而清单F给出了地址簿条目的HTML视图。 在本文中,我们通过分析PlainTextToXmlFormatter类而学会了如何把常用格式数据转换成XML文档。我们还看到了如何借助于XSLT转换而用不同的视图来表示XML文档。当你需要处理各种格式的数据时,采纳上述技术或许就就是一个好的解决方案,从而节省了你的宝贵时间并减少了出错的可能性。 |
-- 作者:robin21_cn -- 发布时间:10/20/2005 3:21:00 PM -- xiexie 顶上啊 |
-- 作者:比尔熊 -- 发布时间:10/20/2005 7:38:00 PM -- 能介绍一下, XML在网页制作中的好处吗? |
-- 作者:Roham -- 发布时间:10/29/2005 1:32:00 PM -- 学习,又上了一个台阶 |
-- 作者:skulldownz -- 发布时间:10/29/2005 4:40:00 PM -- 能像我这样说吗? XML就是个文本化的数据... 但是我看到他不好的一面...就是他不是个数据库..而是一张树表...? |
-- 作者:hqh200023607 -- 发布时间:11/10/2005 8:04:00 PM -- 又学习一些新的东西,但不知道自主你在文中所说的代码C、D、E、F之类的在什么地方啊,到哪里去找啊 |
-- 作者:78wang -- 发布时间:11/11/2005 1:51:00 AM -- 问一下,我的HTML基础也不怎么样呢....可以不可以一下子就学XML |
-- 作者:78wang -- 发布时间:11/11/2005 1:53:00 AM -- 嗯,学到东东了. |
-- 作者:unihan -- 发布时间:11/12/2005 8:19:00 PM -- 好像没有讲完啊,具体例子还没有给呢 |
-- 作者:matida -- 发布时间:11/14/2005 11:59:00 AM -- 偏题了吧... |
-- 作者:bujisky -- 发布时间:1/19/2006 8:35:00 PM -- 看了,顶了 |
-- 作者:wealp -- 发布时间:1/23/2006 10:29:00 AM -- 不懂所以 |
-- 作者:hldhl -- 发布时间:1/23/2006 10:56:00 AM -- 谢谢。 顶起来。。支持一下楼主 |
-- 作者:mdisk -- 发布时间:5/14/2006 8:43:00 PM -- 想看到清单 |
-- 作者:mayan -- 发布时间:5/16/2006 10:56:00 PM -- 人笨看不懂 |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
105.469ms |