全國服務熱線:400-080-4418
(上海網(wǎng)絡優(yōu)化)摘要:電子商務在現(xiàn)代商務活動中的正變得日趨重要,而商務數(shù)據(jù)的處理則凸顯出數(shù)據(jù)挖掘的重要。本文討論了數(shù)據(jù)挖掘的主要方法,具體闡述了數(shù)據(jù)挖掘技術在電子商務中的作用及應用。
一、概述(上海企業(yè)網(wǎng)站建設)
數(shù)據(jù)挖掘(Data Mining)起源于數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡且終可理解的及有潛在應用價值的信息或模式。數(shù)據(jù)挖掘技術是計算機技術發(fā)展的熱點之一。
通過對歷史積累的大量數(shù)據(jù)的有效挖掘,可以發(fā)現(xiàn)隱藏的規(guī)律或模式,為決策提供支持,而這些規(guī)律或模式是不能夠依靠簡單的數(shù)據(jù)查詢得到,或者是不能在可接受的時間內(nèi)得到。這些規(guī)律或模式可以進一步在專業(yè)人員的識別下成為知識,并可以應用到以客戶為中心的企業(yè)決策分析和管理的各個不同領域和階段。
電子商務(E-Commerce)是以指利用電子數(shù)據(jù)交換(Electronic Data Interchange,EDI)、電子郵件(E-mail)、電子資金轉(zhuǎn)賬(Electronic Funds Transfer,EFT)和Internet等主要技術在個人、企業(yè)和國家之間進行無紙化的信息交換,包括商品信息及其訂購信息、資金信息及其支付信息、安全及其認證信息等,即以現(xiàn)代信息技術為手段,以經(jīng)濟效益為中心的現(xiàn)代化商業(yè)運轉(zhuǎn)模式。其終目標是實現(xiàn)商務活動的網(wǎng)絡化、自動化與智能化。
隨著Internet的迅速發(fā)展,電子商務的應用不斷深入。在電子商務應用系統(tǒng)中,相關的用戶數(shù)據(jù)日益增多,數(shù)據(jù)挖掘技術具有從大量復雜數(shù)據(jù)中發(fā)現(xiàn)特定規(guī)律的能力。商業(yè)電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性。
二、數(shù)據(jù)挖掘的主要方法(上海網(wǎng)站建設)
數(shù)據(jù)挖掘融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學等多個領域的理論和技術。比較典型的數(shù)據(jù)挖掘方法有分類、關聯(lián)規(guī)則分析、聚類分析和孤立點分析等。
1.分類。分類是找出一個類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,一般用規(guī)則或決策樹模式表示。實際上就是通過分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他數(shù)據(jù)庫中的記錄進行分類。
2關聯(lián)規(guī)則分析。關聯(lián)規(guī)則分析用于發(fā)現(xiàn)關聯(lián)規(guī)則。若兩個或多個數(shù)據(jù)項的取值重復出現(xiàn)且概率很高時,它就存在著某種關聯(lián),可以建立起這些數(shù)據(jù)項的關聯(lián)規(guī)則,一般用“支持度”和“置信度”兩個閩值來淘汰那些無用的關聯(lián)規(guī)則。關聯(lián)規(guī)則分析能發(fā)現(xiàn)數(shù)據(jù)庫中諸如“90%的顧客在一次購買活動中購買商品A的同時購買商品B”之類的特征。
3.聚類分析。聚類分析的對象是一組未分類記錄,并且這些記錄應分成幾類事先也不知道。聚類就是通過分析數(shù)據(jù)庫中的記錄數(shù)據(jù),根據(jù)一定的分類規(guī)則,合理地劃分記錄集合,確定每個記錄所在類別。它所采用的分類規(guī)則是由聚類分析工具決定的。采用不同的聚類方法,對于相同的記錄集合可能有不同的劃分結果。
4.孤立點分析。數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,這些記錄稱為孤立點,常常包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。孤立點分析基本方法是尋找觀測結果與參照之間的差別。
三、據(jù)據(jù)挖掘在的應用(上海做網(wǎng)站)
數(shù)據(jù)挖掘的應用十分廣泛,如銀行、電信、保險、交通、零售(如超級市場)等領域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括數(shù)據(jù)庫營銷(Database Marketing)、客戶群體劃分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉銷售(Cross-selling)等市場分析行為,以及客戶流失性分析(Churn Analysis)、客戶信用記分(Credit Scoring)和欺詐發(fā)現(xiàn)(Fraud Detection)等。[Page]
分類的目的是構造一個分類函數(shù)或分類模型,通常稱作分類器。分類器的構造方法通常由統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法等。在金融領域,管理者可以通過對客戶償還能力以及信用的分析,進行分類,評出等級,減少放貸的盲目性,提高資金的使用效率。
在零售業(yè),數(shù)據(jù)挖掘可有助于識別顧客購買行為,發(fā)現(xiàn)顧客購買模式和趨勢,改進服務質(zhì)量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設計更好的貨品運輸與分銷策略,減少商業(yè)成本。
電信、計算機網(wǎng)絡、因特網(wǎng)和各種其它方式的通信和計算的融合是目前的大勢所趨。利用數(shù)據(jù)挖掘技術來幫助理解商業(yè)行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務質(zhì)量是非常有必要的,通過挖掘進行盜用模式分析和異常模式識別,從而可盡早發(fā)現(xiàn)盜用,為公司減少損失。數(shù)據(jù)挖掘是一個非常復雜的過程。每一種數(shù)據(jù)挖掘技術方法都有其自身的特點和實現(xiàn)步驟。每種數(shù)據(jù)挖掘的技術方法對輸入/輸出數(shù)據(jù)形式的要求、結構、參數(shù)設置、訓練、測試和模型評價方式各自有不同的要求,算法應用領域的含義和能力也存在差異。數(shù)據(jù)挖掘過程一般分為定義問題、準備數(shù)據(jù)、實施挖掘、評價與表示等幾個階段。數(shù)據(jù)挖掘過程的這幾個階段都需要人的參與指導。(企業(yè)網(wǎng)站建設)
四、結束語
數(shù)據(jù)挖掘是指按企業(yè)既定業(yè)務目標,對大量的企業(yè)數(shù)據(jù)進行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性,并進一步將其模型化的先進有效的方法。電子商務是現(xiàn)代信息技術發(fā)展的必然結果,也是未來商業(yè)運作模式的必然選擇。企業(yè)數(shù)據(jù)量日益龐大,其中真正有價值的信息卻很少,利用數(shù)據(jù)挖掘技術,從大量的數(shù)據(jù)中經(jīng)過深層分析,獲得有利于商業(yè)運作、提高競爭力的信息,發(fā)揮企業(yè)的獨特優(yōu)勢,促進管理創(chuàng)新和技術創(chuàng)新。(企業(yè)網(wǎng)站建設)
現(xiàn)在這個互聯(lián)網(wǎng)時代,企業(yè)網(wǎng)站已經(jīng)成為了企業(yè)營銷推廣的基礎,更是品牌建設中不可或缺的部分,但是網(wǎng)站也不..
許多公司為了滿足自身發(fā)展的需要,會建立屬于自己公司網(wǎng)站。每個公司在制作網(wǎng)站的時候都需要有產(chǎn)品和服務營..
Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號-13
滬公網(wǎng)安備 31011402007386號
關于我們 | 聯(lián)系我們 | 網(wǎng)站建設