91精品人妻互换日韩精品久久影视|又粗又大的网站激情文学制服91|亚州A∨无码片中文字慕鲁丝片区|jizz中国无码91麻豆精品福利|午夜成人AA婷婷五月天精品|素人AV在线国产高清不卡片|尤物精品视频影院91日韩|亚洲精品18国产精品闷骚

您當前位置:首頁 > 新聞頻道 > 技術動態(tài) > 正文
芻議電子商務中數(shù)據(jù)挖掘技術的應用

[摘要]隨著電子商務的普及和數(shù)據(jù)挖掘技術的發(fā)展,將數(shù)據(jù)挖掘技術應用到電子商務中可以解決電子商務中數(shù)據(jù)量龐大的問題,從而獲得真正有價值的信息。文章簡要的介紹了電子商務以及數(shù)據(jù)挖掘的概念,并對電子商務中所使用到的數(shù)據(jù)挖掘技術進行了詳細的分析。
論文關鍵詞:電子商務,數(shù)據(jù)挖掘,聚類分析,關聯(lián)規(guī)則挖掘
  1引言
  隨著Internet的普及,電子商務得到了前所未有的發(fā)展,經(jīng)銷商和客戶之間通過互聯(lián)網(wǎng)進行交易,節(jié)省了大量的費用和時間。但是在電子商務中充斥著大量的數(shù)據(jù),如何從這些大量的數(shù)據(jù)中挖掘出真正有價值的信息,幫助企業(yè)經(jīng)銷商制定更好的營銷策略是電子商務急需解決的問題。數(shù)據(jù)挖掘,又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database, KDD),也就是從大量的數(shù)據(jù)中挖掘出有用信息的一種技術。利用數(shù)據(jù)挖掘技術可以使經(jīng)銷商從大量的數(shù)據(jù)中挖掘出有用的信息幫助決策,從而在市場競爭中獲得優(yōu)勢地位。
  2電子商務概述
  電子商務指交易當事人或參與人利用現(xiàn)代信息技術和計算機網(wǎng)絡(主要是因特網(wǎng))所進行的各類商業(yè)活動,包括貨物貿(mào)易、服務貿(mào)易和知識產(chǎn)權貿(mào)易。“電子商務”中所包括的“現(xiàn)代信息技術”應涵蓋各種使用電子技術為基礎的通信方式;“商務”指不論是契約型還是非契約型的一切商務性質(zhì)的關系所引起的種種事項。如果將“現(xiàn)代信息技術”看作一個子集,“商務”看作另一個子集,電子商務所涵蓋的范圍應當是這兩個子集所形成的交集,即“電子商務”標題之下可能廣泛涉及的因特網(wǎng)、內(nèi)部網(wǎng)和電子數(shù)據(jù)交換在貿(mào)易方面的各種用途。
  電子商務與傳統(tǒng)商務相比有以下優(yōu)點:(1)電子商務將傳統(tǒng)的商務流程數(shù)字化、電子化,讓傳統(tǒng)的商務流程轉(zhuǎn)化為電子流、信息流,突破了時間空間的局限,大大提高了商業(yè)運作的效率。(2)電子商務簡化了企業(yè)與企業(yè),企業(yè)與個人之間的流通環(huán)節(jié),最大限度地降低了流通成本,能有效地提高企業(yè)在現(xiàn)代商業(yè)活動中的競爭力。(3)電子商務是基于互聯(lián)網(wǎng)的一種商務活動,互聯(lián)網(wǎng)本身具有開放性全球性特點,電子商務可為企業(yè)及個人提供豐富的信息資源,為企業(yè)創(chuàng)造更多商業(yè)機會。(4)電子商務對大型企業(yè)和中小企業(yè)都有利,因為大中型企業(yè)需要買賣交易活動多,實現(xiàn)電子商務能有效地進行管理和提高效率,對小企業(yè)同樣有利,因為電子商務可以使企業(yè)以相近的成本進行網(wǎng)上交易,這樣使中小企業(yè)可能擁有和大企業(yè)一樣的流通渠道和信息資源,極大提高了中小企業(yè)的競爭力。(5)電子商務將大部分商務活動搬到網(wǎng)上進行,企業(yè)可以實行無紙化辦公節(jié)省了開支。
  3數(shù)據(jù)挖掘技術
  數(shù)據(jù)挖掘(Data Mining,DM)技術是隨著計算機的廣泛應用和數(shù)據(jù)的大量積累而發(fā)展起來的。數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取或“挖掘”知識,即發(fā)現(xiàn)其中隱含的,未知的,有意義的信息的過程,它又被稱為“數(shù)據(jù)庫中知識發(fā)現(xiàn)”(KDD),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)的一個基本步驟,知識發(fā)現(xiàn)過程由以下步驟組成:(1)數(shù)據(jù)清理(2)數(shù)據(jù)集成(3)數(shù)據(jù)選擇(4)數(shù)據(jù)變換(5)數(shù)據(jù)挖掘(6)模式評估(7)知識表示。
  從商業(yè)的角度定義,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術,其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關鍵性數(shù)據(jù)。利用功能強大的數(shù)據(jù)挖掘技術,可以使企業(yè)把數(shù)據(jù)轉(zhuǎn)化為有用的信息幫助決策,從而在市場競爭中獲得優(yōu)勢地位。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析的不同是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所得到的信息應具有先前未知、有效和實用3個特征。
  4數(shù)據(jù)挖掘在電子商務中的作用
  數(shù)據(jù)挖掘技術之所以可以服務于電子商務,是因為它能夠挖掘出活動過程中的潛在信息以指導電子商務活動。在電子商務中的作用有7個方面:(1)挖掘客戶活動顧慮,針對性的在電子商務平臺下提供“個性化”的服務。(2)可以在瀏覽電子商務網(wǎng)站的訪問者中挖掘出潛在的客戶。(3)通過電子商務訪問者的活動信息的挖掘,可以更加深入的了解客戶需求。(4)通過挖掘網(wǎng)上顧客的購買行為,可以幫助制定合理的產(chǎn)品策略和定價策略。(5)通過對商品訪問情況和銷售情況進行挖掘,可以幫助制定產(chǎn)品營銷策略,優(yōu)化促銷活動。(6)優(yōu)化電子商務網(wǎng)站的信息導航,方便客戶瀏覽。(7)通過客戶在網(wǎng)絡上瀏覽時的擁塞記錄發(fā)現(xiàn)網(wǎng)站的性能瓶頸,從而提高網(wǎng)站的穩(wěn)定性,保證電子商務購物快速進行。
  5電子商務中數(shù)據(jù)挖掘的技術與方法
  電子商務中的數(shù)據(jù)挖掘過程一般包括3個主要的階段:數(shù)據(jù)準備、數(shù)據(jù)挖掘、結果解釋和評價。(1)數(shù)據(jù)準備又可分為數(shù)據(jù)選取和數(shù)據(jù)預處理兩個步驟。數(shù)據(jù)選取的目的是確定發(fā)現(xiàn)任務的操作對象。即目標數(shù)據(jù),是根據(jù)用戶的需要從原始數(shù)據(jù)庫中抽取的一組數(shù)據(jù)。數(shù)據(jù)預處理一般包括消除噪聲、推導計算缺值數(shù)據(jù)、消除重復記錄、完成數(shù)據(jù)類型轉(zhuǎn)換以及對數(shù)據(jù)降維。(2)數(shù)據(jù)挖掘階段首先要確定數(shù)據(jù)挖掘的目標和挖掘的知識類型。確定挖掘任務后,根據(jù)挖掘的知識類型選擇合適的挖掘算法,最后實施數(shù)據(jù)挖掘操作,運用選定的挖掘算法從數(shù)據(jù)庫中抽取所需的知識。(3)結果的解釋和評價。數(shù)據(jù)挖掘階段發(fā)現(xiàn)的知識,經(jīng)過評估,可能存在冗余或無關的知識,這時需要將其剔除,也有可能知識不滿足用戶的需求,需要重復上述挖掘過程重新進行挖掘。另外,由于數(shù)據(jù)挖掘最終要面臨用戶,因此,還需要對所挖掘的知識進行解釋,以一種用戶易于理解的方式供用戶所使用。
  數(shù)據(jù)挖掘按照其挖掘任務主要包括分類和預測、聚類分析、關聯(lián)規(guī)則挖掘,回歸發(fā)現(xiàn)和序列模式發(fā)現(xiàn)等技術。在選擇某種數(shù)據(jù)挖掘技術之前,首先要將需要解決的問題轉(zhuǎn)化成正確的數(shù)據(jù)挖掘任務,然后根據(jù)挖掘的任務來選擇使用哪些數(shù)據(jù)挖掘技術。在電子商務活動中,主要使用下面的一些數(shù)據(jù)挖掘技術。
  5.1分類
  分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型或分類函數(shù),將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別。分類的主要方法有基于決策樹模型的數(shù)據(jù)分類,貝葉斯分類算法,ID3算法和基于BP神經(jīng)網(wǎng)絡算法等。
  假定現(xiàn)在我們有一個描述顧客屬性的數(shù)據(jù)庫,包括他們的姓名、年齡、收入、職業(yè)等,我們可以按照他們是否購買某種商品(例如,計算機)來進行分類。如果現(xiàn)在有新的顧客添加到數(shù)據(jù)庫中,我想將新計算機的銷售信息通知顧客,若將促銷材料分發(fā)給數(shù)據(jù)庫中的每個新顧客,如此可能會導致耗費較多的精力和物力。而若我們只給那些可能購買新計算機的顧客分發(fā)材料,可以在較大的程度上節(jié)省成本。為此,可以構造和使用分類模型。分類方法的特點是通過對示例數(shù)據(jù)庫中的數(shù)據(jù)進行分析,已經(jīng)建立了一個分類模型,然后利用分類模型對數(shù)據(jù)庫中的其它記錄進行分類。
  5.2聚類分析
  聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。聚類分析的方法是數(shù)據(jù)挖掘領域最為常見的技術之一。常用的聚類分析方法有:分割聚類方法,層次聚類方法,基于密度的聚類方法和高維稀疏聚類算法等。聚類分析方法與分類方法的不同之處是聚類事先對數(shù)據(jù)集的分布沒有任何的了解。因此在聚集之后要有一個對業(yè)務很熟悉的人來解釋這樣聚集的意義。 很多情況下一次聚集你得到的分類對你的業(yè)務來說可能并不好,這時你需要刪除或增加變量以影響分類的方式,經(jīng)過幾次反復之后才能最終得到一個理想的結果。聚類分析方法在電子商務中的使用也極其廣泛。其中一個典型的應用是幫助市場分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群,并且用購買模式來刻畫不同客戶群的特征。通過對聚類的客戶特征的提取,把客戶群分成更細的市場,提供針對性的服務。
  5.3關聯(lián)規(guī)則挖掘
  關聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在關系的規(guī)則,即根據(jù)一個事物中的某些項的出現(xiàn)可導出另一些項在同一事物中也出現(xiàn),即隱藏在數(shù)據(jù)間的關聯(lián)或相互關系,比如在一次購買活動中所買不同商品的相關性。在電子商務中,從大量商務事物記錄中發(fā)現(xiàn)有趣的關聯(lián)關系,可以幫助許多商務決策的制定。關聯(lián)規(guī)則挖掘最初也是最典型的形式是購物籃分析。它通過發(fā)現(xiàn)顧客放入其購物籃中不同商品之間聯(lián)系,分析顧客的購買習慣。例如,在同一次去超級市場,如果顧客購買牛奶,他也購買面包(包括購買什么類型的面包)的可能性有多大?這些信息可以幫助零售商有選擇地經(jīng)銷和安排貨架,引導銷售。例如,將牛奶和面包盡可能放近一些,可以進一步刺激一次去商店同時購買這些商品。在電子商務中,由于Web服務器的日志文件記錄了用戶的訪問記錄,通過這些記錄利用關聯(lián)規(guī)則挖掘網(wǎng)上顧客購買產(chǎn)品的相關度,對某些品牌的喜好和忠誠,價格接受范圍,以及包裝要求等,挖掘的結果可以用來幫助管理者進行網(wǎng)站規(guī)劃、確定商品的種類、價格和新產(chǎn)品的投入。
  5.4序列模式分析
  序列模式分析和關聯(lián)規(guī)則挖掘相似,但側重點在分析數(shù)據(jù)間的前后序列關系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如在某一段時間內(nèi),顧客購買商品A,接著購買商品B,而后購買商品C,即序列A-B-C出現(xiàn)的頻度較高的信息。序列模式分析的一個例子是“九個月以前購買奔騰PC的客戶很可能在一個月內(nèi)訂購新的CPU芯片”。
  6結束語
  電子商務過程中的各種信息和數(shù)據(jù)是電子商務活動能夠更好的進行的基礎,通過選擇合適的數(shù)據(jù)挖掘技術來挖掘電子商務中有價值的信息,從而使企業(yè)在激烈的市場競爭中做出正確的決策,保持有力的競爭優(yōu)勢。隨著數(shù)據(jù)挖掘技術的不斷發(fā)展,我們相信它在電子商務中的應用將促使其得到更快更高效的發(fā)展。
參考文獻:
[1]姚淼.《數(shù)據(jù)挖掘在電子商務中的應用》.高校圖書情報論壇.Mar.2009.Vol.8 No.1
[2]趙雁.張黎明.呂安.趙彥慧.《電子商務中的數(shù)據(jù)挖掘技術》.中國電子學會第十屆青年學術年會論文集.2004.9
[3]楊青杰.胡明霞.《數(shù)據(jù)挖掘技術在電子商務中的應用研究》.商場現(xiàn)代化.2008年第16期
[4]韓家煒.《數(shù)據(jù)挖掘概念與技術》.機械工業(yè)出版社.2001
[5]扈闖.《談如何在電子商務中使用數(shù)據(jù)挖掘技術》.大眾文藝(理論).2004年第04期

關鍵字:通訊
About Us - 關于我們 - 服務列表 - 付費指導 - 媒體合作 - 廣告服務 - 版權聲明 - 聯(lián)系我們 - 網(wǎng)站地圖 - 常見問題 - 友情鏈接
Copyright©2014安裝信息網(wǎng) m.78375555.com. All rights reserved.
服務熱線:4000-293-296 聯(lián)系電話:0371-61311617 傳真:0371-55611201 QQ: 郵箱:zgazxxw@126.com 豫ICP備18030500號-4
未經(jīng)過本站允許,請勿將本站內(nèi)容傳播或復制
安全聯(lián)盟認證