电子商务中的搜索引擎
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9
与IR相关的eCommerce思路:eFACT
eFACT: Universal Q/A Database
• 目标:Answer any question over web
• 增量式创建一个规模巨大的FAQ库,按主题领 域分类
• 雇用人员在线回答问题,报酬可以是免费享受 这个FAQ服务或者就是现金
13
网络实名(3721)
• 企业购买词语 • 系统建立“词语网站”对应关系 • 查询计费 • 为便利用户,开辟“地址栏”直接服务,
从而不需要显式登上3721
• 在建立起名气和流量之前有一个业务拓 展的learning curve
14
竞价排名(百度,Google)
• 基于搜索引擎的流量所派生的业务 • 基本假设:产品和服务可以用一些词来刻画
• The absence of both fails gloriously (Pets.com, Webvan.com, …)
3
Some Ingredients for a Successful eBusiness Startup (2)
B2C and C2C eBusiness Examples • 对Web信息的搜索与浏览
(例如“鲜花”,“家电维修”),在搜索引 擎上输入那些词的用户有一个%是想购买相应 的产品或者服务 • 向企业宣传这个概念,鼓励他们来“买词”, 例如海尔可能会买“空调”,“电冰箱”等
– 全国有70000多家有一定名气的企业
15
竞价排名
• 一个企业可能买多个词,多个企业可能买同一 个词,可以出不同的价
– FreeMarkets, Commerce One, I2, ... – 我愿意最多出100元买X,但三天后决定,出价吧!
• Full N-to-N eMarketplaces(全方位供销)
Ariba, Dynamix, ...
• Financial Services
Treasurypoint.com, MyCFO.com, ...
17
天网知名度
• 假设:名人、名企业、政府机构,都会 关心自己在网络媒体上的形象
• 广泛收集,针对性过滤(多对多)
– 基本词项加query expansion,以追求高的 “相关性”,例如,“王菲”,“流行歌 手”,“香港”
• 收费
– 征订模式:按月发简报 – 应急服务模式:搞了一场什么活动收集反响18
意的“良师益友”完全一样!
10
与IR相关的eCommerce思路: iSELL
iSELL: Meta Auction eSite(元拍卖) • 目标:The Metacrawler of Web Auction Sites • 用户描述他要卖的东西 • iSELL找到一个(或者多个)最合适的拍卖网站
A: SUN Microsystems
Q: Who is the largest provider of bandwidth for eCommerce?
21
eBusiness Ingredients (3)
But, Better Technology Also Wins • On B2C search-portals:
Google > AltaVista & Lycos > WebCrawler Though WebCrawler was "first" • On licensable B2B search engines: Google-engine > Inktomi & Verity > others though Verity came first
电子商务中的搜索引擎
参考Jaime Carbonell教授的讲义
1
商务应用和模型
Topics Covered
• eBusiness创业的若干要素 • eCommerce的若干创意样例 • 成熟企业eExtension的若干要素 • eBusiness Plan的若干要素
2
Some Ingredients for a Successful eBusiness Startup (1)
• 执行规则
– 如果词X有企业购买,则当用户查询X的时候返回结 果的头几条为出资的企业占有
– 如果词Y没有企业购买(例如“高等数学”),则 返回结果按相关性排序
– 如果企业A, B买了X,且出资A(X) > B(X),则当用 户查询X的时候,A会排在B的前面
– 计费当用户点击网站链接时发生
16
竞价排名
(e.g. Ch 3-7 of "Intro to IR" + Ch 5-6 of "Web IR" + Ch 2 of "Applied Linear Algebra") “Web-based eCom textbook” • 打印,装订,邮递50本以上;或者发送 单本电子版(通过PDF加电子水印保护)
23
将传统的业务拓展到eBusiness (1)
Q: Who is the largest system integrator for web applications?
A: IBM
Q: Who are the largest consultant for web applications?
A: IBM and Accenture
– 搜索引擎,类似于Yahoo的门户网站,locators, ...
• 在线成交(On-line trading)
– eBrokerages(中介), eAuctions(拍卖), eMiniMalls(商城), ...
• People-to-people
chatrooms, email, instant-messaging, peer-topeer...
– 最相关且新颖的新闻就直接留下,其次的做综述, 其余的就放弃
• 给用户提供表态机会,并利用用户的表态做系 统的自动调整
– 例如,“别再来关于搜狐的消息了”,“别放过关 于新推出搜索引擎的新闻”
• 收入模型:订阅,广告, ...
6
与IR相关的eCommerce思路:ePUB
ePUB: 定制出版(Customized Publishing) • 目标:综合不同书籍的不同部分,提供定
4
与IR相关的eCommerce思路:eCLIP
eCLIP: 适应性电子剪报
• 目标:个性化eNewspaper
(weekly, daily, hourly)
• 用户建立自己的兴趣profile,例如
关心: "finance>eCommerce>technology"
"science>astronomy"
8
ePUB的变形
eBooks: 在线销售eBook内容(例如方正的 Apabi电子书)
• Books, magazines, comic-books, reference, ... • 让读者可以在线全文检索
– Not just title/author as in Amazon
• 只是对下载的内容收费(eArticles, eBooks, eSections of books) ,当然也可以提供纸质 的内容。Pay for what you read (only).
Leabharlann Baidu
– 如果系统已有的答案能和新来的问题匹配,直接给 出答案,否则就发给人员处理,或者将问题整理成
查询送到一个搜索引擎上,给用户返回一些网页
(虽然不是答案,但目前只能这样),过后再通过 email送答案
• Essentially do AskJeeves the right way
• 类似于上交大的“answer machine”,和韩华创
– 卖类似的东西(通过检查用户描述和网站描述的相似 度确定)
– 最好的价钱
• iSELL的metaform自动的连到相关的拍卖网站, 并使其物品在那些网站上列表出现;一旦卖出, 就从所有列表上删除
• iSELL得到售价的一个%以及广告收入
11
与IR相关的eCommerce思路: WebRATE
WebRATE: Rating Service for eSites • 目标:Become Nielsen’s or CU or USN&WR等
网站分析评估机构 • 得到一个网站和其他网站的相似程度, ... • 客户网站为内容评估,访问流量统计等项目付
费 • 也许还可以收取租用费,可用于市场开拓的数
据费 (traffic, stickiness, favorites entries,…)
12
ASP eBusiness: WebMINER
• 合理性:基本假设 + 统计规律 • 用户
– 好,能帮我更快的寻求商品或服务 – 不好,我并不想买东西,只是希望得到相关知识信
息,将那些厂家排在前面,我烦!
• 商家
– 好,比在电视、报纸上做广告还有效(点击了我的 很大一部分就是有购买的意向,我只为点击付钱)
– 不好,谁知道有多少人要上你这里来查我的产品, 还有财大气粗的就要排在我前面!
企业竞争情报系统
19
eBusiness Ingredients
B2B Examples
• 对intranets和企业文档数据库的内容建立索引
– 提供搜索引擎,文本提取等服务(天网SE4Campus)
• 在Web基础设施上的优化
Akamai, 托管(信息、服务器等)服务,“燕捷”
• 供货网络,逆向拍卖(reverse auction)
Q: Who is the largest seller of web-related software?
A: Microsoft
Q: Who is the largest software provider to eCommerce sites?
A: ORACLE
Q: Who is the largest hardware provider to eCommerce sites?
不关心: "sports" "politics>scandals"
关键词项:“ecommerce”,“search engine”, “IPO”(知识产权所有者),
Hubble"
5
与IR相关的eCommerce思路:eCLIP (2)
• 多种新闻来源在收集时分类,然后用用户的 profiles过滤
WebMINER: 提供数据挖掘服务 • 这属于B2B eService,租用,或者咨询 • 基本工作方式是从客户那里下载业务数
据以及一些和挖掘目标相关的属性数据 • 收费:发现的规则,模式,以及被挖掘
的数据量 • 对于流数据的挖掘可以采用“征订模型”
(Subscription model),按天、按月等
• 寻求技术和市场的匹配(match technology and market)
• Great technology without a large market potential fails
• Great market opportunity without requisite reliable technology also fails
20
eBusiness Ingredients (2)
First Mover Advantage Often Wins • Amazon, buy.com > other eTailers • Yahoo > other portals • Ebay >> other auction sites • Dell-on-web > other web PC vendors
制的书籍(教材,手册,等) • 对所有掌握的书籍资源以章节为单位建立
索引 • 让用户免费搜索、浏览、编辑
(利用MMR和综述技术等) • 下载/打印/装订/递送等则要收费
7
与IR相关的eCommerce思路:ePUB (2)
ePUB: Customized Publishing • 为用户装配一本定制的书
22
eBusiness Ingredients (4)
Find New Niche in eEcology(在数字生态 中发现新的生机)
• FreeMarkets in B2B reverse auctions • Treasurypoint/Wisdom: Managing and
optimizing corporate treasuries (ASP) • IBM and BEA in web-based middleware • Dynamix: Generalized trading engine
与IR相关的eCommerce思路:eFACT
eFACT: Universal Q/A Database
• 目标:Answer any question over web
• 增量式创建一个规模巨大的FAQ库,按主题领 域分类
• 雇用人员在线回答问题,报酬可以是免费享受 这个FAQ服务或者就是现金
13
网络实名(3721)
• 企业购买词语 • 系统建立“词语网站”对应关系 • 查询计费 • 为便利用户,开辟“地址栏”直接服务,
从而不需要显式登上3721
• 在建立起名气和流量之前有一个业务拓 展的learning curve
14
竞价排名(百度,Google)
• 基于搜索引擎的流量所派生的业务 • 基本假设:产品和服务可以用一些词来刻画
• The absence of both fails gloriously (Pets.com, Webvan.com, …)
3
Some Ingredients for a Successful eBusiness Startup (2)
B2C and C2C eBusiness Examples • 对Web信息的搜索与浏览
(例如“鲜花”,“家电维修”),在搜索引 擎上输入那些词的用户有一个%是想购买相应 的产品或者服务 • 向企业宣传这个概念,鼓励他们来“买词”, 例如海尔可能会买“空调”,“电冰箱”等
– 全国有70000多家有一定名气的企业
15
竞价排名
• 一个企业可能买多个词,多个企业可能买同一 个词,可以出不同的价
– FreeMarkets, Commerce One, I2, ... – 我愿意最多出100元买X,但三天后决定,出价吧!
• Full N-to-N eMarketplaces(全方位供销)
Ariba, Dynamix, ...
• Financial Services
Treasurypoint.com, MyCFO.com, ...
17
天网知名度
• 假设:名人、名企业、政府机构,都会 关心自己在网络媒体上的形象
• 广泛收集,针对性过滤(多对多)
– 基本词项加query expansion,以追求高的 “相关性”,例如,“王菲”,“流行歌 手”,“香港”
• 收费
– 征订模式:按月发简报 – 应急服务模式:搞了一场什么活动收集反响18
意的“良师益友”完全一样!
10
与IR相关的eCommerce思路: iSELL
iSELL: Meta Auction eSite(元拍卖) • 目标:The Metacrawler of Web Auction Sites • 用户描述他要卖的东西 • iSELL找到一个(或者多个)最合适的拍卖网站
A: SUN Microsystems
Q: Who is the largest provider of bandwidth for eCommerce?
21
eBusiness Ingredients (3)
But, Better Technology Also Wins • On B2C search-portals:
Google > AltaVista & Lycos > WebCrawler Though WebCrawler was "first" • On licensable B2B search engines: Google-engine > Inktomi & Verity > others though Verity came first
电子商务中的搜索引擎
参考Jaime Carbonell教授的讲义
1
商务应用和模型
Topics Covered
• eBusiness创业的若干要素 • eCommerce的若干创意样例 • 成熟企业eExtension的若干要素 • eBusiness Plan的若干要素
2
Some Ingredients for a Successful eBusiness Startup (1)
• 执行规则
– 如果词X有企业购买,则当用户查询X的时候返回结 果的头几条为出资的企业占有
– 如果词Y没有企业购买(例如“高等数学”),则 返回结果按相关性排序
– 如果企业A, B买了X,且出资A(X) > B(X),则当用 户查询X的时候,A会排在B的前面
– 计费当用户点击网站链接时发生
16
竞价排名
(e.g. Ch 3-7 of "Intro to IR" + Ch 5-6 of "Web IR" + Ch 2 of "Applied Linear Algebra") “Web-based eCom textbook” • 打印,装订,邮递50本以上;或者发送 单本电子版(通过PDF加电子水印保护)
23
将传统的业务拓展到eBusiness (1)
Q: Who is the largest system integrator for web applications?
A: IBM
Q: Who are the largest consultant for web applications?
A: IBM and Accenture
– 搜索引擎,类似于Yahoo的门户网站,locators, ...
• 在线成交(On-line trading)
– eBrokerages(中介), eAuctions(拍卖), eMiniMalls(商城), ...
• People-to-people
chatrooms, email, instant-messaging, peer-topeer...
– 最相关且新颖的新闻就直接留下,其次的做综述, 其余的就放弃
• 给用户提供表态机会,并利用用户的表态做系 统的自动调整
– 例如,“别再来关于搜狐的消息了”,“别放过关 于新推出搜索引擎的新闻”
• 收入模型:订阅,广告, ...
6
与IR相关的eCommerce思路:ePUB
ePUB: 定制出版(Customized Publishing) • 目标:综合不同书籍的不同部分,提供定
4
与IR相关的eCommerce思路:eCLIP
eCLIP: 适应性电子剪报
• 目标:个性化eNewspaper
(weekly, daily, hourly)
• 用户建立自己的兴趣profile,例如
关心: "finance>eCommerce>technology"
"science>astronomy"
8
ePUB的变形
eBooks: 在线销售eBook内容(例如方正的 Apabi电子书)
• Books, magazines, comic-books, reference, ... • 让读者可以在线全文检索
– Not just title/author as in Amazon
• 只是对下载的内容收费(eArticles, eBooks, eSections of books) ,当然也可以提供纸质 的内容。Pay for what you read (only).
Leabharlann Baidu
– 如果系统已有的答案能和新来的问题匹配,直接给 出答案,否则就发给人员处理,或者将问题整理成
查询送到一个搜索引擎上,给用户返回一些网页
(虽然不是答案,但目前只能这样),过后再通过 email送答案
• Essentially do AskJeeves the right way
• 类似于上交大的“answer machine”,和韩华创
– 卖类似的东西(通过检查用户描述和网站描述的相似 度确定)
– 最好的价钱
• iSELL的metaform自动的连到相关的拍卖网站, 并使其物品在那些网站上列表出现;一旦卖出, 就从所有列表上删除
• iSELL得到售价的一个%以及广告收入
11
与IR相关的eCommerce思路: WebRATE
WebRATE: Rating Service for eSites • 目标:Become Nielsen’s or CU or USN&WR等
网站分析评估机构 • 得到一个网站和其他网站的相似程度, ... • 客户网站为内容评估,访问流量统计等项目付
费 • 也许还可以收取租用费,可用于市场开拓的数
据费 (traffic, stickiness, favorites entries,…)
12
ASP eBusiness: WebMINER
• 合理性:基本假设 + 统计规律 • 用户
– 好,能帮我更快的寻求商品或服务 – 不好,我并不想买东西,只是希望得到相关知识信
息,将那些厂家排在前面,我烦!
• 商家
– 好,比在电视、报纸上做广告还有效(点击了我的 很大一部分就是有购买的意向,我只为点击付钱)
– 不好,谁知道有多少人要上你这里来查我的产品, 还有财大气粗的就要排在我前面!
企业竞争情报系统
19
eBusiness Ingredients
B2B Examples
• 对intranets和企业文档数据库的内容建立索引
– 提供搜索引擎,文本提取等服务(天网SE4Campus)
• 在Web基础设施上的优化
Akamai, 托管(信息、服务器等)服务,“燕捷”
• 供货网络,逆向拍卖(reverse auction)
Q: Who is the largest seller of web-related software?
A: Microsoft
Q: Who is the largest software provider to eCommerce sites?
A: ORACLE
Q: Who is the largest hardware provider to eCommerce sites?
不关心: "sports" "politics>scandals"
关键词项:“ecommerce”,“search engine”, “IPO”(知识产权所有者),
Hubble"
5
与IR相关的eCommerce思路:eCLIP (2)
• 多种新闻来源在收集时分类,然后用用户的 profiles过滤
WebMINER: 提供数据挖掘服务 • 这属于B2B eService,租用,或者咨询 • 基本工作方式是从客户那里下载业务数
据以及一些和挖掘目标相关的属性数据 • 收费:发现的规则,模式,以及被挖掘
的数据量 • 对于流数据的挖掘可以采用“征订模型”
(Subscription model),按天、按月等
• 寻求技术和市场的匹配(match technology and market)
• Great technology without a large market potential fails
• Great market opportunity without requisite reliable technology also fails
20
eBusiness Ingredients (2)
First Mover Advantage Often Wins • Amazon, buy.com > other eTailers • Yahoo > other portals • Ebay >> other auction sites • Dell-on-web > other web PC vendors
制的书籍(教材,手册,等) • 对所有掌握的书籍资源以章节为单位建立
索引 • 让用户免费搜索、浏览、编辑
(利用MMR和综述技术等) • 下载/打印/装订/递送等则要收费
7
与IR相关的eCommerce思路:ePUB (2)
ePUB: Customized Publishing • 为用户装配一本定制的书
22
eBusiness Ingredients (4)
Find New Niche in eEcology(在数字生态 中发现新的生机)
• FreeMarkets in B2B reverse auctions • Treasurypoint/Wisdom: Managing and
optimizing corporate treasuries (ASP) • IBM and BEA in web-based middleware • Dynamix: Generalized trading engine