中文字幕色综合久久_亚洲欧美日韩国产精品26u_一级特黄色毛片免费看_免费观看一级毛片

聚類分析

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

聚類分析指將物理或抽象對(duì)象的集合分組成為由類似的對(duì)象組成的多個(gè)類的分析過程。它是一種重要的人類行為。

聚類與分類的不同在于,聚類所要求劃分的類是未知的。

聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。

聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。聚類源于很多領(lǐng)域,包括數(shù)學(xué),計(jì)算機(jī)科學(xué),統(tǒng)計(jì)學(xué),生物學(xué)和經(jīng)濟(jì)學(xué)。在不同的應(yīng)用領(lǐng)域,很多聚類技術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類到不同的簇中。

從統(tǒng)計(jì)學(xué)的觀點(diǎn)看,聚類分析是通過數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法。傳統(tǒng)的統(tǒng)計(jì)聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動(dòng)態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。采用k-均值、k-中心點(diǎn)等算法的聚類分析工具已被加入到許多著名的統(tǒng)計(jì)分析軟件包中,如SPSS、SAS等。

從機(jī)器學(xué)習(xí)的角度講,簇相當(dāng)于隱藏模式。聚類是搜索簇的無監(jiān)督學(xué)習(xí)過程。與分類不同,無監(jiān)督學(xué)習(xí)不依賴預(yù)先定義的類或帶類標(biāo)記的訓(xùn)練實(shí)例,需要由聚類學(xué)習(xí)算法自動(dòng)確定標(biāo)記,而分類學(xué)習(xí)的實(shí)例或數(shù)據(jù)對(duì)象有類別標(biāo)記。聚類是觀察式學(xué)習(xí),而不是示例式的學(xué)習(xí)。

從實(shí)際應(yīng)用的角度看,聚類分析是數(shù)據(jù)挖掘的主要任務(wù)之一。而且聚類能夠作為一個(gè)獨(dú)立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇?cái)?shù)據(jù)的特征,集中對(duì)特定的聚簇集合作進(jìn)一步地分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。  

目錄

主要應(yīng)用

在商業(yè)上

聚類分析被用來發(fā)現(xiàn)不同的客戶群,并且通過購買模式刻畫不同的客戶群的特征。

聚類分析是細(xì)分市場(chǎng)的有效工具,同時(shí)也可用于研究消費(fèi)者行為,尋找新的潛在市場(chǎng)、選擇實(shí)驗(yàn)的市場(chǎng),并作為多元分析的預(yù)處理。  

在生物上

聚類分析被用來動(dòng)植物分類和對(duì)基因進(jìn)行分類,獲取對(duì)種群固有結(jié)構(gòu)的認(rèn)識(shí)  

在地理上

聚類能夠幫助在地球中被觀察的數(shù)據(jù)庫商趨于的相似性  

在保險(xiǎn)行業(yè)上

聚類分析通過一個(gè)高的平均消費(fèi)來鑒定汽車保險(xiǎn)單持有者的分組,同時(shí)根據(jù)住宅類型,價(jià)值,地理位置來鑒定一個(gè)城市的房產(chǎn)分組  

在因特網(wǎng)應(yīng)用上

聚類分析被用來在網(wǎng)上進(jìn)行文檔歸類來修復(fù)信息  

在電子商務(wù)上

聚類分析在電子商務(wù)中網(wǎng)站建設(shè)數(shù)據(jù)挖掘中也是很重要的一個(gè)方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,可以更好的幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。  

主要步驟

1. 數(shù)據(jù)預(yù)處理,

2. 為衡量數(shù)據(jù)點(diǎn)間的相似度定義一個(gè)距離函數(shù),

3. 聚類或分組,

4. 評(píng)估輸出。

數(shù)據(jù)預(yù)處理包括選擇數(shù)量,類型和特征的標(biāo)度,它依靠特征選擇和特征抽取,特征選擇選擇重要的特征,特征抽取把輸入的特征轉(zhuǎn)化為一個(gè)的顯著特征,它們經(jīng)常被用來獲取一個(gè)合適的特征集來為避免“維數(shù)災(zāi)”進(jìn)行聚類,數(shù)據(jù)預(yù)處理還包括將孤立點(diǎn)移出數(shù)據(jù),孤立點(diǎn)是不依附于一般數(shù)據(jù)行為或模型的數(shù)據(jù),因此孤立點(diǎn)經(jīng)常會(huì)導(dǎo)致有偏差的聚類結(jié)果,因此為了得到正確的聚類,我們必須將它們剔除。

既然相類似性是定義一個(gè)類的基礎(chǔ),那么不同數(shù)據(jù)之間在同一個(gè)特征空間相似度的衡量對(duì)于聚類步驟是很重要的,由于特征類型和特征標(biāo)度的多樣性,距離度量必須謹(jǐn)慎,它經(jīng)常依賴于應(yīng)用,例如,通常通過定義在特征空間的距離度量來評(píng)估不同對(duì)象的相異性,很多距離度都應(yīng)用在一些不同的領(lǐng)域,一個(gè)簡(jiǎn)單的距離度量,如Euclidean距離,經(jīng)常被用作反映不同數(shù)據(jù)間的相異性,一些有關(guān)相似性的度量,例如PMC和SMC,能夠被用來特征化不同數(shù)據(jù)的概念相似性,在圖像聚類上,子圖圖像的誤差更正能夠被用來衡量?jī)蓚€(gè)圖形的相似性。

將數(shù)據(jù)對(duì)象分到不同的類中是一個(gè)很重要的步驟,數(shù)據(jù)基于不同的方法被分到不同的類中,劃分方法和層次方法是聚類分析的兩個(gè)主要方法,劃分方法一般從初始劃分和最優(yōu)化一個(gè)聚類標(biāo)準(zhǔn)開始。Crisp Clustering,它的每一個(gè)數(shù)據(jù)都屬于單獨(dú)的類;Fuzzy Clustering,它的每個(gè)數(shù)據(jù)可能在任何一個(gè)類中,Crisp Clustering和Fuzzy Clusterin是劃分方法的兩個(gè)主要技術(shù),劃分方法聚類是基于某個(gè)標(biāo)準(zhǔn)產(chǎn)生一個(gè)嵌套的劃分系列,它可以度量不同類之間的相似性或一個(gè)類的可分離性用來合并和分裂類,其他的聚類方法還包括基于密度的聚類,基于模型的聚類,基于網(wǎng)格的聚類。

評(píng)估聚類結(jié)果的質(zhì)量是另一個(gè)重要的階段,聚類是一個(gè)無管理的程序,也沒有客觀的標(biāo)準(zhǔn)來評(píng)價(jià)聚類結(jié)果,它是通過一個(gè)類有效索引來評(píng)價(jià),一般來說,幾何性質(zhì),包括類間的分離和類內(nèi)部的耦合,一般都用來評(píng)價(jià)聚類結(jié)果的質(zhì)量,類有效索引在決定類的數(shù)目時(shí)經(jīng)常扮演了一個(gè)重要角色,類有效索引的最佳值被期望從真實(shí)的類數(shù)目中獲取,一個(gè)通常的決定類數(shù)目的方法是選擇一個(gè)特定的類有效索引的最佳值,這個(gè)索引能否真實(shí)的得出類的數(shù)目是判斷該索引是否有效的標(biāo)準(zhǔn),很多已經(jīng)存在的標(biāo)準(zhǔn)對(duì)于相互分離的類數(shù)據(jù)集合都能得出很好的結(jié)果,但是對(duì)于復(fù)雜的數(shù)據(jù)集,卻通常行不通,例如,對(duì)于交疊類的集合。  

聚類分析算法

聚類分析是數(shù)據(jù)挖掘中的一個(gè)很活躍的研究領(lǐng)域,并提出了許多聚類算法。傳統(tǒng)的聚類算法可以被分為五類:劃分方法、層次方法、基于密度方法、基于網(wǎng)格方法和基于模型方法。

1 劃分方法(PAM:PArtitioning method) 首先創(chuàng)建k個(gè)劃分,k為要?jiǎng)?chuàng)建的劃分個(gè)數(shù);然后利用一個(gè)循環(huán)定位技術(shù)通過將對(duì)象從一個(gè)劃分移到另一個(gè)劃分來幫助改善劃分質(zhì)量。典型的劃分方法包括:

k-means,k-medoids,CLARA(Clustering LARge Application),

CLARANS(Clustering Large Application based upon RANdomized Search).

FCM

2 層次方法(hierarchical method) 創(chuàng)建一個(gè)層次以分解給定的數(shù)據(jù)集。該方法可以分為自上而下(分解)和自下而上(合并)兩種操作方式。為彌補(bǔ)分解與合并的不足,層次合

并經(jīng)常要與其它聚類方法相結(jié)合,如循環(huán)定位。典型的這類方法包括:

BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies) 方法,它首先利用樹的結(jié)構(gòu)對(duì)對(duì)象集進(jìn)行劃分;然后再利用其它聚類方法對(duì)這些聚類進(jìn)行優(yōu)化。

CURE(Clustering Using REprisentatives) 方法,它利用固定數(shù)目代表對(duì)象來表示相應(yīng)聚類;然后對(duì)各聚類按照指定量(向聚類中心)進(jìn)行收縮。

ROCK方法,它利用聚類間的連接進(jìn)行聚類合并。

CHEMALOEN方法,它則是在層次聚類時(shí)構(gòu)造動(dòng)態(tài)模型。

3 基于密度的方法,根據(jù)密度完成對(duì)象的聚類。它根據(jù)對(duì)象周圍的密度(如DBSCAN)不斷增長(zhǎng)聚類。典型的基于密度方法包括:

DBSCAN(Densit-based Spatial Clustering of Application with Noise):該算法通過不斷生長(zhǎng)足夠高密度區(qū)域來進(jìn)行聚類;它能從含有噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。此方法將一個(gè)聚類定義為一組“密度連接”的點(diǎn)集。

OPTICS(Ordering Points To Identify the Clustering Structure):并不明確產(chǎn)生一個(gè)聚類,而是為自動(dòng)交互的聚類分析計(jì)算出一個(gè)增強(qiáng)聚類順序。。

4 基于網(wǎng)格的方法,首先將對(duì)象空間劃分為有限個(gè)單元以構(gòu)成網(wǎng)格結(jié)構(gòu);然后利用網(wǎng)格結(jié)構(gòu)完成聚類。

STING(STatistical INformation Grid) 就是一個(gè)利用網(wǎng)格單元保存的統(tǒng)計(jì)信息進(jìn)行基于網(wǎng)格聚類的方法。

CLIQUE(Clustering In QUEst)和Wave-Cluster 則是一個(gè)將基于網(wǎng)格與基于密度相結(jié)合的方法。

5 基于模型的方法,它假設(shè)每個(gè)聚類的模型并發(fā)現(xiàn)適合相應(yīng)模型的數(shù)據(jù)。典型的基于模型方法包括:

統(tǒng)計(jì)方法COBWEB:是一個(gè)常用的且簡(jiǎn)單的增量式概念聚類方法。它的輸入對(duì)象是采用符號(hào)量(屬性-值)對(duì)來加以描述的。采用分類樹的形式來創(chuàng)建一個(gè)層次聚類。

CLASSIT是COBWEB的另一個(gè)版本.。它可以對(duì)連續(xù)取值屬性進(jìn)行增量式聚類。它為每個(gè)結(jié)點(diǎn)中的每個(gè)屬性保存相應(yīng)的連續(xù)正態(tài)分布(均值與方差);并利用一個(gè)改進(jìn)的分類能力描述方法,即不象COBWEB那樣計(jì)算離散屬性(取值)和而是對(duì)連續(xù)屬性求積分。但是CLASSIT方法也存在與COBWEB類似的問題。因此它們都不適合對(duì)大數(shù)據(jù)庫進(jìn)行聚類處理.

傳統(tǒng)的聚類算法已經(jīng)比較成功的解決了低維數(shù)據(jù)的聚類問題。但是由于實(shí)際應(yīng)用中數(shù)據(jù)的復(fù)雜性,在處理許多問題時(shí),現(xiàn)有的算法經(jīng)常失效,特別是對(duì)于高維數(shù)據(jù)和大型數(shù)據(jù)的情況。因?yàn)閭鹘y(tǒng)聚類方法在高維數(shù)據(jù)集中進(jìn)行聚類時(shí),主要遇到兩個(gè)問題。①高維數(shù)據(jù)集中存在大量無關(guān)的屬性使得在所有維中存在簇的可能性幾乎為零;②高維空間中數(shù)據(jù)較低維空間中數(shù)據(jù)分布要稀疏,其中數(shù)據(jù)間距離幾乎相等是普遍現(xiàn)象,而傳統(tǒng)聚類方法是基于距離進(jìn)行聚類的,因此在高維空間中無法基于距離來構(gòu)建簇。

高維聚類分析已成為聚類分析的一個(gè)重要研究方向。同時(shí)高維數(shù)據(jù)聚類也是聚類技術(shù)的難點(diǎn)。隨著技術(shù)的進(jìn)步使得數(shù)據(jù)收集變得越來越容易,導(dǎo)致數(shù)據(jù)庫規(guī)模越來越大、復(fù)雜性越來越高,如各種類型的貿(mào)易交易數(shù)據(jù)、Web 文檔、基因表達(dá)數(shù)據(jù)等,它們的維度(屬性)通常可以達(dá)到成百上千維,甚至更高。但是,受“維度效應(yīng)”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運(yùn)用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個(gè)非常活躍的領(lǐng)域,同時(shí)它也是一個(gè)具有挑戰(zhàn)性的工作。目前,高維數(shù)據(jù)聚類分析在市場(chǎng)分析、信息安全、金融、娛樂、反恐等方面都有很廣泛的應(yīng)用。

關(guān)于“聚類分析”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個(gè)人工具
名字空間
動(dòng)作
導(dǎo)航
推薦工具
功能菜單
工具箱
中文字幕色综合久久_亚洲欧美日韩国产精品26u_一级特黄色毛片免费看_免费观看一级毛片
国内成+人亚洲+欧美+综合在线 | 色综合久久久久| 精品一区二区三区不卡| 蜜桃av一区二区在线观看| 天堂一区二区在线| 日本不卡不码高清免费观看| 奇米在线7777在线精品| 久久er精品视频| 懂色av一区二区夜夜嗨| 91网站最新地址| 欧美日本免费一区二区三区| 日韩欧美一二三四区| 久久久久久久久久久久电影| 中文字幕一区在线观看视频| 亚洲国产一二三| 裸体歌舞表演一区二区| 成人av网址在线| 精品视频1区2区| 久久精品人人爽人人爽| 亚洲激情在线播放| 精品一区精品二区高清| av成人免费在线观看| 欧美顶级少妇做爰| 国产精品久久毛片a| 午夜久久久久久久久| 国产精品99久久久久久似苏梦涵| 成人免费黄色在线| 91精品国产综合久久久久久漫画 | 亚洲激情第一区| 美女脱光内衣内裤视频久久影院| 成人性生交大合| 在线不卡中文字幕| 日韩一区中文字幕| 激情综合网天天干| 欧美日韩国产一级| 国产精品激情偷乱一区二区∴| 丝袜美腿亚洲色图| 色94色欧美sute亚洲线路一久| 精品久久久久久久久久久院品网| 亚洲欧美激情插 | 久久99热这里只有精品| 91视频在线观看| 久久精品一区二区三区四区| 亚洲国产精品人人做人人爽| 成人免费高清在线| 久久综合成人精品亚洲另类欧美 | 国产一区美女在线| 欧美人与禽zozo性伦| 亚洲日本一区二区| 成人永久免费视频| 久久综合九色综合97_久久久| 石原莉奈一区二区三区在线观看| 91视视频在线直接观看在线看网页在线看| 日韩美女在线视频| 日产精品久久久久久久性色| 在线看不卡av| 亚洲精品中文字幕乱码三区| 国产精品系列在线观看| 日韩欧美国产精品| 日本aⅴ免费视频一区二区三区| 在线观看成人免费视频| 亚洲人成亚洲人成在线观看图片| 福利一区在线观看| 国产三级久久久| 国产精品一区二区黑丝| 久久精品网站免费观看| 国产麻豆视频一区| 久久久蜜桃精品| 国产精品1区2区3区| 国产亚洲va综合人人澡精品| 国产麻豆精品在线观看| 国产精品免费久久| 99re这里只有精品6| 亚洲婷婷综合色高清在线| 一本色道久久综合精品竹菊| 亚洲欧美日韩一区二区 | 粉嫩在线一区二区三区视频| 亚洲国产经典视频| 一本大道av伊人久久综合| 亚洲激情五月婷婷| 欧美喷水一区二区| 久久国产麻豆精品| 欧美激情一区二区三区全黄| 成人黄色一级视频| 亚洲一区二区三区四区的| 91精品国产综合久久精品麻豆| 日本美女一区二区三区视频| 欧美大白屁股肥臀xxxxxx| 国产福利一区二区三区视频| 国产精品天天看| 欧美日韩中文字幕精品| 久久精品国产澳门| 国产欧美日韩另类一区| 色综合天天综合色综合av| 首页综合国产亚洲丝袜| 26uuu国产在线精品一区二区| 成人av综合在线| 亚洲成a人v欧美综合天堂 | 欧美日韩第一区日日骚| 久久精品国产精品亚洲红杏| 国产精品每日更新在线播放网址| 欧美无砖砖区免费| 福利一区二区在线观看| 午夜欧美视频在线观看| 国产日韩精品视频一区| 欧美日韩五月天| 国产成人综合亚洲91猫咪| 亚洲一二三四区不卡| 久久嫩草精品久久久久| 一本到不卡精品视频在线观看| 蜜桃精品视频在线观看| 国产精品福利在线播放| 欧美一区二区观看视频| 一本到三区不卡视频| 国产精品一区在线| 天天综合日日夜夜精品| 中文字幕亚洲区| 26uuu精品一区二区三区四区在线| 91激情在线视频| 成人深夜视频在线观看| 玖玖九九国产精品| 五月天亚洲婷婷| 一区二区免费在线| 国产精品麻豆视频| 久久久精品日韩欧美| 91精品国产一区二区人妖| 日本韩国欧美三级| 波多野洁衣一区| 国产电影精品久久禁18| 蜜臀av在线播放一区二区三区| 一区二区三区日韩在线观看| 国产精品理论在线观看| 久久久久久久久岛国免费| 91精品国产免费久久综合| 91久久精品网| 色琪琪一区二区三区亚洲区| 成人高清免费观看| 成人sese在线| 99久久精品国产毛片| 成人免费视频caoporn| 国产一区二区精品久久91| 精油按摩中文字幕久久| 久久精品国产久精国产| 久久爱www久久做| 久久国产成人午夜av影院| 日本午夜精品视频在线观看| 亚洲一区成人在线| 亚洲电影一级黄| 日韩国产欧美三级| 蜜臀精品一区二区三区在线观看| 免费高清不卡av| 久久99久久久欧美国产| 国产一区二区伦理| 懂色av一区二区三区免费观看| 成人毛片在线观看| 99在线精品视频| 欧美亚洲国产一区二区三区va | 欧美精品一区二区三区久久久 | 91精品欧美久久久久久动漫| 日韩一区二区三区观看| 久久久精品国产免大香伊 | 免费看黄色91| 国产成人午夜99999| 99综合电影在线视频| 在线视频一区二区免费| 欧美一区二区三区视频| 2024国产精品视频| 国产精品久久久一区麻豆最新章节| 中文字幕一区免费在线观看 | 日韩美女在线视频| 国产精品久久久久久久久免费桃花 | 久久精品亚洲精品国产欧美kt∨ | 不卡的看片网站| 7777精品伊人久久久大香线蕉 | 国产一区二区三区黄视频 | 在线精品视频一区二区三四| 337p亚洲精品色噜噜噜| 国产欧美综合色| 亚洲国产精品麻豆| 国产一区在线看| 欧美性猛交一区二区三区精品| 精品捆绑美女sm三区| 亚洲人成网站影音先锋播放| 麻豆成人av在线| 91福利国产成人精品照片| 久久综合久久综合九色| 亚洲国产一区二区视频| 福利91精品一区二区三区| 欧美二区三区91| 亚洲欧美成人一区二区三区| 精品一二线国产| 欧美日免费三级在线| 国产精品成人一区二区三区夜夜夜| 强制捆绑调教一区二区| 色综合视频一区二区三区高清| 337p日本欧洲亚洲大胆精品| 水蜜桃久久夜色精品一区的特点| 成人动漫一区二区在线| 欧美大片一区二区| 天天影视网天天综合色在线播放|