新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Web Architecture,探讨下一代万维网的架构/体系结构。
    [返回] 中文XML论坛 - 专业的XML技术讨论区W3CHINA.ORG讨论区 - Web新技术讨论『 Web架构 』 → Google正在研究Web结构化数据[转帖] 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 12942 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: Google正在研究Web结构化数据[转帖] 举报  打印  推荐  IE收藏夹 
       本主题类别: Semantic Web    
     kanechen1 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:57
      门派:XML.ORG.CN
      注册:2009/10/25

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给kanechen1发送一个短消息 把kanechen1加入好友 查看kanechen1的个人资料 搜索kanechen1在『 Web架构 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看kanechen1的博客楼主
    发贴心情 Google正在研究Web结构化数据[转帖]

    互联网的搜索引擎们把主要精力都放在采集Web页面的文本信息上,但是Google却在研究如何分析和组织结构化数据方面小有所成,该公司的一位科学家上周五表示。

    “在Web之外存在着大量的结构化数据,但我们却并没有很好地将这些数据展示给用户。”在马萨诸塞州技术研究院举行的新英格兰数据库日会议中,Alon Halevy在一次谈话中这样说道。

    Halevy还谈到了所谓的“深Web”源,比如为Cars.com或者Realtor.com这类表单驱动型网站做后台支撑的数据库资源。Google一直都在不停的向各种表单提交查询请求,然后对返回的结果进行分析,最后将有用的内容加入到索引当中。

    但是该公司仍然希望Web站点们能够将数据存放到结构化的表格中供google分析,Halevy说,例如在Web页面上提供一个表格列举出历任美国总统。

    但是这样的表格也是数量巨大的,据Halevy说,Google的索引中已经收录了140亿个。他“很快就意识到其中有超过98%的内容是用户不感兴趣的,”但即使经过了仔细的筛选之后,仍然有1亿5400万个表格值得被Google索引。

    Google的一个终极目标就是把一个搜索请求的结果组织成“各个方面”返回给用户,特别是像“越南旅游”这种比较宽泛的关键字,而不是“越南人口”这种非常具体的关键字,Halevy说,前面的搜索请求可能会产生关于签证条件、气候、旅行团等这类信息。

    Kosmix已经在做这个点子了,但是Google将会做的更多,Halevy说,“Kosmix的确能够展示出‘方面’,但是它依赖于特定的信息源。”

    在Kosmix上搜素“越南旅游”,它会给你提供一个结果集,包括纽约时报关于酒店的评论,来自雅虎和Flickr的图片,来自Shopping.com的购物信息以及来自Google的其他信息。

    “而我们则不同,各方面信息都来自于Web的搜索结果,但会以不同的方式组织起来。”Halevy说。


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/10/25 14:59:00
     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Web架构 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客2
    发贴心情 
    谷歌所研究的结构化数据应该和我们所说的本体数据有很大差别的吧。
    谷歌似乎更偏重于数据库和数据表一类的数据吧。

    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/10/26 11:26:00
     
     zq490391612 帅哥哟,离线,有人找我吗?天秤座1987-10-7
      
      
      等级:大一新生
      文章:11
      积分:99
      门派:XML.ORG.CN
      注册:2009/11/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zq490391612发送一个短消息 把zq490391612加入好友 查看zq490391612的个人资料 搜索zq490391612在『 Web架构 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看zq490391612的博客3
    ===============================
    该用户发言已被管理员屏蔽
    ===============================
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/11/12 15:03:00
     
     liuliang9767 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:70
      门派:XML.ORG.CN
      注册:2010/10/25

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liuliang9767发送一个短消息 把liuliang9767加入好友 查看liuliang9767的个人资料 搜索liuliang9767在『 Web架构 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liuliang9767的博客4
    发贴心情 
    http://www.taocaibang.com/job.php?mod=view&jid=65082
    数码公社互动运营专员
    ss
    搜狐公司
    公司类型:外资(欧美) 公司规模:500人以上 ss
    发布时间 :2010-10-16 工作年限 :不限 工作方式 :全职 薪金待遇 :面议 性别要求 :不限 学历要求 :本科 招聘人数 :2 到期时间 :2010-11-15 户口要求 :无要求
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/10/25 13:50:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Web架构 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/12/18 9:12:06

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms