關于數(shù)據(jù)挖掘技術的電子商務推薦系統(tǒng)研究論文
1.數(shù)據(jù)挖掘技術

1.1數(shù)據(jù)挖掘概述
所謂數(shù)據(jù)挖掘就是指在眾多數(shù)據(jù)中抽取有用資料的過程,這些有用的資料是在海量數(shù)據(jù)中經(jīng)過篩選、過濾、清洗、提取出來的,能體現(xiàn)客戶潛在需求。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析相比,數(shù)據(jù)挖掘具有預知性、有效性和實用性等特點。傳統(tǒng)的數(shù)據(jù)分析則是定向分析、費用高、不能及時有效的提供相關數(shù)據(jù),具有一定的局限性。而數(shù)據(jù)挖掘通過利用多種分析工具,來對大量的數(shù)據(jù)進行抽取分析,發(fā)現(xiàn)數(shù)據(jù)中蘊含的關系或規(guī)則,對商業(yè)決策具有重要支持性作用。
1.2數(shù)據(jù)挖掘的功能
數(shù)據(jù)挖掘往往有兩類任務:一是描述,二是預測。對于描述性任務幾乎都是利用數(shù)據(jù)挖掘技術對數(shù)據(jù)刻畫其普遍特性,而預測性任務則是根據(jù)現(xiàn)有的數(shù)據(jù)進行分析預測。當前,數(shù)據(jù)挖掘功能有以下幾類:
1.2.1利用概念描述發(fā)現(xiàn)廣義知識
通過對某類對象進行細致描述,從而對該數(shù)據(jù)進行概括、提煉。而概念描述又分為兩類,一種是描述同類對象的共性,即為特征性描述。另一種是描述異類對象的異性,即為區(qū)別性描述。
1.2.2利用關聯(lián)分析發(fā)現(xiàn)關聯(lián)知識
利用不同變量的取值,發(fā)現(xiàn)他們存在某種關系,而這往往是屬于被發(fā)現(xiàn)的重要資料。這種關聯(lián)往往分成三類,即簡單關聯(lián)、時序關聯(lián)、因果關聯(lián),等等。
1.2.3利用分類和聚類方法發(fā)現(xiàn)分類知識
將數(shù)據(jù)對象分類或者將數(shù)據(jù)對象分成多個簇,來發(fā)現(xiàn)其同類對象的共性和異類對象的異性相關知識。
1.2.4利用預測方法獲取預測型知識
利用過去或者當前的與時間有關的數(shù)據(jù)對未來的相關數(shù)據(jù)進行推測。
1.2.5采用偏差檢測來獲取偏差型知識
利用數(shù)據(jù)庫中的異常數(shù)據(jù)進行分析,解釋出現(xiàn)異,F(xiàn)象的原因。
1.3數(shù)據(jù)挖掘過程
從查找數(shù)據(jù)開始,通過一定的算法或模型發(fā)現(xiàn)數(shù)據(jù)間的關聯(lián)性,并提取出新的知識或規(guī)律,從而得出新的結論。這一流程包括以下幾個步驟:首先,提出陳述的問題和要闡明的假設,從中發(fā)現(xiàn)問題,提出假設,利用相關數(shù)據(jù)去發(fā)現(xiàn),去解釋其原因,從中得到完善。其次是收集數(shù)據(jù)。有關數(shù)據(jù)的收集分為兩類:一類是可控數(shù)據(jù),另一類是不可控數(shù)據(jù)。采用不同的收集方法收集出來的結果也是不同的。因此,在收集過程中要知道數(shù)據(jù)收集是如何對其理論分布產(chǎn)生影響的,這樣才能在應用中順利進行。再次是數(shù)據(jù)的預處理。通過完成異常點的檢測和比例縮放、編碼和選擇特征等常見任務,來對數(shù)據(jù)挖掘過程中諸多預處理活動進行說明性例證。之后是對模型進行評估。先建立一些新模型,并進行評估選出最佳模型,數(shù)據(jù)挖掘技術利用該模型對數(shù)據(jù)進行分析。最后解釋模型得出結論。通過對模型的解釋使數(shù)據(jù)挖掘所得出來的結果更加容易理解,簡單明了,為決策者提供決策支持。
2.數(shù)據(jù)挖掘與電子商務
2.1電子商務發(fā)展中存在的問題
大量網(wǎng)絡商品的涌現(xiàn),不論是買方或是賣方都會面臨著諸多問題。數(shù)據(jù)挖掘技術的出現(xiàn)為電子商務活動提供了強大的數(shù)據(jù)分析和技術支持。數(shù)據(jù)挖掘是面向應用的,電子商務的發(fā)展使得越來越多的企業(yè)開始網(wǎng)上交易,電子商務后臺數(shù)據(jù)庫中客戶相關的數(shù)據(jù)和大量的交易記錄以及跟蹤用戶在Web上的瀏覽行為等數(shù)據(jù)資源中所蘊含著大量的寶貴信息,有待于充分挖掘和利用。
2.2數(shù)據(jù)挖掘在電子商務應用發(fā)展現(xiàn)狀
在電子商務活動中,采用數(shù)據(jù)挖掘技術在國內尚屬于一個初步發(fā)展階段。雖然國內在這一相關領域的研究也取得了很大的進展,但仍存在一些不足之處:其一,實時性與推薦質量不平衡。其二,電子商務推薦體系結構不完善。其三,不能充分地對推薦結果進行解釋。其四,不能全面關注訪問者,只是片面地對銷售商品進行排比。國外利用數(shù)據(jù)挖掘技術來提高電子商務企業(yè)的經(jīng)營效益已取得顯著的成效。據(jù)亞馬遜前科學家GregLimlen介紹,亞馬遜至少有35%的銷售額來自于推薦系統(tǒng)。
2.3數(shù)據(jù)挖掘對電子商務的影響
通過電子商務與數(shù)據(jù)挖掘技術進行優(yōu)化配置,建立合理的電子商務推薦系統(tǒng),采用有效的組合推薦,將所有的推薦模型進行統(tǒng)一管理,同時又能具體情況具體分析,從而對客戶提供精準推薦,讓消費者在較短的時間內獲得較多的“有用”信息,這樣既能增加用戶黏性,又讓商家提升銷量。
3.基于數(shù)據(jù)挖掘的電子商務推薦系統(tǒng)
3.1數(shù)據(jù)挖掘與推薦系統(tǒng)
推薦系統(tǒng)與數(shù)據(jù)挖掘在電子商務平臺中兩者相輔相成,聯(lián)系緊密^電子商務發(fā)展過程中積累了大量的商業(yè)數(shù)據(jù),這些數(shù)據(jù)蘊含了大量的知識,需要數(shù)據(jù)挖掘技術進行提取分析。而推薦系統(tǒng)根據(jù)數(shù)據(jù)挖掘得來的知識,對消費者的興趣和需求進行及時的分析,支持商業(yè)決策。
3.2電子商務推薦系統(tǒng)設計
按照系統(tǒng)論的觀點,可將電子商務推薦系統(tǒng)分成四個組成部分:信息輸人、信息處理、模式發(fā)現(xiàn)與用戶反饋。首先,信息輸人主要來源于數(shù)據(jù)倉庫。其次,信息處理是基于各種不同的算法模型對數(shù)據(jù)倉庫里的數(shù)據(jù)進行分析和處理,挖掘出潛在的規(guī)律或模式,即模式發(fā)現(xiàn)。最后,用戶客觀公正的反饋是評價推薦系統(tǒng)準確性與可信性的主要依據(jù);跀(shù)據(jù)挖掘的電子商務推薦系統(tǒng)設計邏輯模型如圖丨所示。
4.結語
隨著網(wǎng)絡科技的步伐不斷加快,人們對電子商務的需求也不斷加大,收集大量的用戶數(shù)據(jù)進行科學分析,挖掘客戶潛在需求,進行個性化的推薦;跀(shù)據(jù)挖掘技術的電子商務推薦系統(tǒng)搭建起客戶與商家的橋梁,其必然推動電子商務的進一步發(fā)展。
【數(shù)據(jù)挖掘技術的電子商務系統(tǒng)研究論文】相關文章:
數(shù)據(jù)挖掘實習報告10-05
電子商務的論文05-29
電子商務論文06-14
電子商務論文08-30
關于電子商務的論文12-18
電子商務與物流論文11-08
學習電子商務論文11-06
電子商務安全論文05-15
(必備)電子商務的論文07-24
跨境電子商務論文08-27