Bibliographic Latent Semantic Index: No Blames on Users
(書目隱性語義索引:使用者無錯)
這禮拜的課程,所上請來了Mu教授來進行演講,
演講的主題為
"Bibliographic Latent Semantic Index: No Blames on Users"
Mu教授剛開始先自我介紹,也介紹了我們的姐妹校
University of Wisconsin — Milwaukee
●Users Behaviors
1.Very few advanced search features
2.Rarely use Boolean
3.No interested in relevance feedback
一般的使用者,大部分都是使用一般的搜尋引擎的基本搜尋,
很少使用到進階搜尋、布林邏輯、也不重視相關回饋,
所以常會在檢索時發生錯誤,但是「Users always correct」
所以不能說使用者是錯誤的。
●Why people like google?
Because they know we are "thinking" based on what we are "saying"
大部分的人會喜歡使用GOOGLE就是因為他們會在搜尋時直接打上平常的用詞遣字,
而這也牽涉到了Lexical vs. Semantic的問題,
打的字跟想的意思不一定能完全吻合,
因為不是所有人的想法都能夠有相同的表達方式,
所以身為中介者的系統就扮演著很重要的腳色。
● 許多相同或是相關的書籍或者是資料,應該要能夠有所連結,
若是能夠連結起來,那麼對於學術的交流來說是好的,
也更能夠突顯書籍或是資料間的價值。
●What is LSI
1.Remove the "noise" of a document representation
2.In other word, provide a skeleton of document from a different angle
3.Using Singular Value Decomposition (SVD)
Try to capture the key concept
索引時找其最重要的特徵,例如:圖片搜尋馬英九,不一定是會搜尋到本人的照片,
可能會找到和馬英九一樣的鞋子、髮型...等等的圖片。
所以LSI強調它可以Remove the "noise" of a document representation,
這樣一來使用者更能夠更快速,且更有效率的查詢到自己所需要的資訊。
●產品與研究的差別,就在於產品必須要強建,必須要能夠考慮到所有的因素,
但是研究不一樣,研究只著重於某一項因素,其他的因素不需要太過拘泥。
●An Rockwell Question/Answer System 無Page rank,所以用LSI,
而GOOGLE有Page rank,因為其效果比較好,所以不使用LSI。
●LSI與YAHOO同,常用詞檢索做得很好,但是較冷僻的詞效果不佳,
在這方面反而是GOOGLE做的比較好,也就是說,LSI和YAHOO是服務百分之八十的使用者,
GOOGLE則服務另外百分之二十的使用者。
●心得
這堂的演講,讓我學到了許多東西,也見識到了許多新的概念,
不過講義上的一些數學公式,當然是看不太懂。
而Mu教授提到的概念,將相同的東西,分在一起。
我想這是很重要的概念,在這個資訊發展快速的社會裡,
我們的身邊無時無刻的出現了許多的資訊,
所以我們必須要能夠將其相關聯的資訊分在一起,
這樣子不但對於使用者來說更方便,對於學術的進步也更加的有益處,
因為它可以將某領域,或者是某學者的資料,結合在一起,
讓使用者在進行參考的動作時,有更好的工具。
而Mu教授也提到了一些出國唸書的相關事宜,真的是非常的受用,
下禮拜還有一堂演講,期待可以在學到更多的東西。
學術研究與寫作之性質
14 年前
沒有留言:
張貼留言