詞云是什么?如何使用Python創(chuàng)建詞云?
介紹從開始從事數(shù)據(jù)可視化工作的那一天起,我就愛上它了,我總是喜歡從數(shù)據(jù)中獲得有用的見解。在此之前,我只了解基本圖表,例如條形圖,散點(diǎn)圖,直方圖等,這些基本圖表內(nèi)置在tableau中,而Power BI則用于數(shù)據(jù)可視化。通過(guò)每天完成此任務(wù),我遇到了許多新圖表,例如徑向儀表盤,華夫圖等。因此,出于好奇,最近我正在搜索數(shù)據(jù)可視化中使用的所有圖表類型,這些詞云引起了我的注意,我發(fā)現(xiàn)它非常有趣。之后,我嘗試使用Tableau和Power BI中的少量數(shù)據(jù)來(lái)制作詞云,在成功嘗試之后,我想通過(guò)使用條形圖,餅圖和其他圖表的代碼來(lái)嘗試使用它。詞云是什么?定義:詞云是一個(gè)簡(jiǎn)單但功能強(qiáng)大的可視化表示對(duì)象,用于文本處理,它以更大,更粗的字母和不同的顏色顯示最常用的詞,單詞的大小越小,重要性就越小。
詞云的用途
1.社交媒體上的熱門標(biāo)簽(Instagram,Twitter):全世界的社交媒體都在尋找最新的趨勢(shì),因此,我們可以獲取人們?cè)谄涮又惺褂米疃嗟臉?biāo)簽來(lái)探索最新的趨勢(shì)。
2.媒體中的熱門話題:分析新聞報(bào)道,我們可以在頭條新聞中找到關(guān)鍵字,并提取出前n個(gè)需求較高的主題,來(lái)獲得所需的結(jié)果,即前n個(gè)熱門媒體主題。
3.電子商務(wù)中的搜索詞:在電子商務(wù)購(gòu)物網(wǎng)站中,網(wǎng)站所有者可以制作被搜索次數(shù)最多的購(gòu)物商品的詞云,這樣,他就可以了解在特定時(shí)期內(nèi)哪些商品需求量最大。讓我們開始使用Python來(lái)實(shí)現(xiàn)詞云首先,我們需要在jupyter notebook中安裝所有庫(kù)。在python中,我們將安裝一個(gè)內(nèi)置庫(kù)wordcloud。在Anaconda命令提示符下,輸入以下代碼:pip install wordcloud
如果你的anaconda環(huán)境支持conda,請(qǐng)輸入:conda install wordcloud
這可以直接在notebook中實(shí)現(xiàn),只需在代碼的開頭添加“!”即可。像這樣:!pip install wordcloud
但現(xiàn)在我想生成擁有任何主題的維基百科文本的詞云,因此,我將需要一個(gè)Wikipedia庫(kù)來(lái)訪問(wèn)Wikipedia API,可以通過(guò)在anaconda命令提示符下安裝Wikipedia來(lái)完成,如下所示:pip install wikipedia
現(xiàn)在我們還需要其他一些庫(kù),它們是numpy,matplotlib和pandas。截至目前,我們需要的庫(kù)就安裝好了import wikipedia
result= wikipedia.page("MachineLearning")
final_result = result.content
print(final_result)
機(jī)器學(xué)習(xí)維基百科頁(yè)面的輸出:
上圖是我們通過(guò)檢索Wikipedia的機(jī)器學(xué)習(xí)頁(yè)面獲得的輸出圖像,我們還可以看到它可以向下滾動(dòng),這表示將檢索整個(gè)頁(yè)面。在這里,我們還可以通過(guò)摘要方法得到頁(yè)面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)
print(result)
這里我們有句子的參數(shù),因此我們可以用它來(lái)檢索特定的行數(shù)。
輸出5個(gè)句子讓我們一起創(chuàng)建wordcloudfrom wordcloud import WordCloud, StopWords
import matplotlib.pyplot as plt
def plot_cloud(wordcloud):
plt.figure(figsize=(10, 10))
plt.imshow(wordcloud)
plt.a(chǎn)xis("off");
wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)
plot_cloud(wordcloud)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 張勇等人退出阿里合伙人
- 10 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人