大數(shù)據(jù)開(kāi)發(fā)之hive的了解及SQL基礎(chǔ)命令分享

IT小白在線 2021-11-23

展開(kāi)全文

hive（數(shù)據(jù)倉(cāng)庫(kù)工具）

Hive是一個(gè)數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)工具在Hadoop中用來(lái)處理結(jié)構(gòu)化數(shù)據(jù)。它架構(gòu)在Hadoop之上，總歸為大數(shù)據(jù)，并使得查詢和分析方便。并提大數(shù)據(jù)培訓(xùn)供簡(jiǎn)單的sql查詢功能，可以將sql語(yǔ)句轉(zhuǎn)換為MapReduce任務(wù)進(jìn)行運(yùn)行。術(shù)語(yǔ)“大數(shù)據(jù)”是大型數(shù)據(jù)集，其中包括體積龐大，高速，以及各種由與日俱增的數(shù)據(jù)的集合。使用傳統(tǒng)的數(shù)據(jù)管理系統(tǒng)，它是難以加工大型數(shù)據(jù)。因此，Apache軟件基金會(huì)推出了一款名為Hadoop的解決大數(shù)據(jù)管理和處理難題的框架。

SQL

結(jié)構(gòu)化查詢語(yǔ)言(Structured Query Language)簡(jiǎn)稱SQL，是一種數(shù)據(jù)庫(kù)查詢和程序設(shè)計(jì)語(yǔ)言，用于存取數(shù)據(jù)以及查詢、更新和管理關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)；同時(shí)也是數(shù)據(jù)庫(kù)腳本文件的擴(kuò)展名。

結(jié)構(gòu)化查詢語(yǔ)言是高級(jí)的非過(guò)程化編程語(yǔ)言，允許用戶在高層數(shù)據(jù)結(jié)構(gòu)上工作。它不要求用戶指定對(duì)數(shù)據(jù)的存放方法，也不需要用【關(guān)注尚硅谷，輕松學(xué)IT】戶了解具體的數(shù)據(jù)存放方式，所以具有完全不同底層結(jié)構(gòu)的不同數(shù)據(jù)庫(kù)系統(tǒng), 可以使用相同的結(jié)構(gòu)化查詢語(yǔ)言作為數(shù)據(jù)輸入與管理的接口。結(jié)構(gòu)化查詢語(yǔ)言語(yǔ)句可以嵌套，這使它具有極大的靈活性和強(qiáng)大的功能。

常見(jiàn)SQL命令

SELECT 語(yǔ)句

作用：用于從表中選取數(shù)據(jù)，結(jié)果被存儲(chǔ)在一個(gè)結(jié)果表中

語(yǔ)法：select 列名稱 from 表名稱

舉例：select LastName from Person 或 select * from Person

WHERE 子句

作用：如需有條件地從表中選取數(shù)據(jù)，可將 WHERE 子句添加到 SELECT 語(yǔ)句

語(yǔ)法：SELECT 列名稱 FROM 表名稱WHERE 列運(yùn)算符值

舉例：SELECT * FROM Persons WHERE FirstName='John'

ORDER BY 語(yǔ)句

作用：ORDER BY 語(yǔ)句用于根據(jù)指定的列對(duì)結(jié)果集進(jìn)行排序，默認(rèn)按照升序?qū)τ涗涍M(jìn)行排序；如需按照降序，可使用DESC關(guān)鍵字

舉例：ORDER BY SELECT LastName, FirstName FROM Persons ORDER BY FirstName

SELECT DISTINCT

作用：關(guān)鍵字DISTINCT 用于返回唯一不同的值

語(yǔ)法：SELECT DISTINCT 列名稱 FROM 表名稱

舉例：要從Company列中僅選取唯一不同的值，

SELECTDISTINCT Company FROM Orders

AND 和 OR 運(yùn)算符

作用: AND 和 OR 可在 WHERE 子語(yǔ)句中把兩個(gè)或多個(gè)條件結(jié)合起來(lái)。

如果第一個(gè)條件和第二個(gè)條件都成立，則 AND 運(yùn)算符顯示一條記錄。

如果第一個(gè)條件和第二個(gè)條件中只要有一個(gè)成立，則 OR 運(yùn)算符顯示一條記錄

舉例：使用 AND 來(lái)顯示所有姓為 "Carter" 并且名為 "Thomas" 的人

SELECT* FROM Persons WHERE FirstName='Thomas' AND LastName='Carter'

SUM() 函數(shù)

作用：SUM 函數(shù)返回?cái)?shù)值列的總數(shù)（總額）

語(yǔ)法：SELECT SUM(column_name) FROM table_name

舉例：

我們希望查找 "OrderPrice" 字段的總數(shù)

SELECTSUM(OrderPrice) AS OrderTotal FROM Orders

GROUP BY 語(yǔ)句

“GroupBy”從字面意義上理解就是根據(jù)“By”指定的規(guī)則對(duì)數(shù)據(jù)進(jìn)行分組，所謂的分組就是將一個(gè)“數(shù)據(jù)集”劃分成若干個(gè)“小區(qū)域”，然后針對(duì)若干個(gè)“小區(qū)域”進(jìn)行數(shù)據(jù)處理

舉例：

select類別, sum(數(shù)量) as 數(shù)量之和fromA

groupby 類別

返回結(jié)果如下表，實(shí)際上就是分類匯總。

實(shí)例介紹：

1. 從persona_data_info 表中，查詢job_id=279 的每個(gè)gender類別的人數(shù)總和

select gender,sum(persona_count) from persona_data_info where job_id=279 group by gender;

2. 從persona_data_city ,persona_city_map兩個(gè)表中查詢job_id=279且citycode= map.code

SELECTjob_id,citycode,persona_count,province,region,city_level FROM persona_data_city,persona_city_map where job_id=279 AND persona_data_city.citycode =persona_city_map.`code`;

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自： IT小白在線 > 《大數(shù)據(jù)》

舉報(bào)/認(rèn)領(lǐng)