一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

木舟| 數(shù)據(jù)與大數(shù)據(jù)知識概括 | 《信息技術(shù)》(2021版)二次學習微視頻001

 木舟u2497sll0j 2021-12-03

信息技術(shù)(新教材)第一章知識概括


(建議在WIFI環(huán)境下觀看)

(必修1)第一章:數(shù)據(jù)與大數(shù)據(jù)

在《信息技術(shù)》課程中,教材圍繞學科四個大概念展開,分別是數(shù)據(jù)、算法、信息系統(tǒng)和信息社會,這從我們兩冊教材的各章節(jié)標題中有很清晰的體現(xiàn)。我們今天主要就必修一第一章的知識進行簡單的概括。

我們首先需要理清幾個概念:

數(shù)據(jù)是對事物描述的記錄,它基于客觀事實,一般可由觀察得到。一般來說,數(shù)據(jù)經(jīng)過處理,可能會產(chǎn)生信息。而大量信息,經(jīng)過結(jié)構(gòu)化處理,可以轉(zhuǎn)化為知識。當我們掌握了一定量的知識,對這些知識進行深入理解、內(nèi)化,可以形成我們個人的智慧。

也可以這樣理解:數(shù)據(jù)是抽象的內(nèi)容,在獨立時沒有意義。信息是經(jīng)過處理的數(shù)據(jù),挖掘出了數(shù)據(jù)中隱含的意義。而知識是經(jīng)過人為的解讀和個人經(jīng)驗充實的信息。智慧是個體知識內(nèi)化后產(chǎn)生的辨析、判斷、發(fā)明創(chuàng)造能力。

為了便于大家理解,我們做一個不太恰當?shù)念惐?。比如這里我們看到的兩列數(shù)據(jù),如果不知道它們是漢字的機內(nèi)碼,那么它沒有意義,可以類比為數(shù)據(jù)。如果我們通過某種工具軟件,可以知道它們分別代表了漢字“慎”和“獨”在計算機內(nèi)存儲時的狀態(tài),那這時也就可以看作信息。將“慎”和“獨”兩個字組成詞“慎獨”,如果我們經(jīng)過學習和解讀,可以知道這個詞最早出自《禮記》,是中國儒家知識分子修身養(yǎng)性的一種方法,并且被很多歷史名人作為自己的座右銘,那么其實就可以看作是知識了。同時,經(jīng)過對這個詞的深入理解、內(nèi)化,讓慎獨所蘊含的標準作為個人生活、學習的行為準則,并身體力行,其實可以看作個人具備了這樣的智慧。

當然,以上類比可能不太確切,特別是最底層關(guān)于數(shù)據(jù)的類比,這兩行二進制代碼作為漢字的機內(nèi)碼,本身就是已經(jīng)處理過的數(shù)據(jù),和我們教材所講的數(shù)據(jù)的概念不太一樣,這一點還是需要大家注意。

我們的課程名稱是《信息技術(shù)》,可以簡單理解為處理信息的技術(shù),所以我們還要重點了解信息的概念和特征。

信息學奠基人香農(nóng)認為“信息是能夠用來消除不確定性的東西”。關(guān)于這個概念,看起來有點抽象,我們可以簡單理解為:如果我們確定要做某件事,當我們沒有任何信息的時候,這個事情成功與否的概率很低,也就是不確定性很高,當我們對于這件事?lián)碛辛艘欢ǖ男畔?,可能成功的概率就會提升,也就是說消除了不確定性。同時,關(guān)于信息的概念,信息管理專家霍頓認為:信息是為了滿足用戶決策的需要而經(jīng)過加工處理的數(shù)據(jù)。

了解了信息的概念,我們還要知道信息具備這樣的特征。一是“信息可以傳播和存儲”,比如我們手機拍了一張照片,這張照片中的信息就可以保存在手機里,如果我們通過微信發(fā)給自己的朋友,就實現(xiàn)了信息的傳播;二是“信息的價值是相對的”。對于同一條信息,會因為持有者需求、使用目的的不同而呈現(xiàn)出不同的價值;三是“信息可以被共享。”物質(zhì)、能源和信息是當今社會人類生活的三個主要資源,和物質(zhì)與能源相比,信息的共享性特征非常明顯,正如蕭伯納曾說過:“如果你有一個蘋果,我有一個蘋果,彼此交換,我們每個人仍然只有一個蘋果。”這表明物質(zhì)是不能共享的。但是“如果你有一種思想,我有一種思想,彼此交換,我們每個人就有了兩種思想,甚至多于兩種思想。”這其實很好的體現(xiàn)了信息的共享性。四是“信息具有時效性?!痹诓煌臅r間點上,同樣的信息所體現(xiàn)的價值可能是不同的,甚至差距很大。

在前面霍頓關(guān)于信息的定義中,我們看到,信息是經(jīng)過加工處理的數(shù)據(jù)。其實從古至今,人們一直在處理信息,只是到了近現(xiàn)代,隨著計算機及附屬設備的出現(xiàn),人們處理信息的能力得到了極大的提升,我們當前所說的信息技術(shù),主要是指這個方面。但是,這里有一個前提,也就是讓計算機幫助我們處理信息,必須將以文字、圖片、聲音、視頻等可視的信息(載體)數(shù)字化。

計算機作為一種電子設備,由于構(gòu)造的關(guān)系,它們只“認識”二進制數(shù),所以信息的數(shù)字化就是將各種形式的信息轉(zhuǎn)化為二進制數(shù)形式的過程,也叫信息的編碼。

字符、漢字、圖片、聲音、視頻等這些信息的載體在計算機內(nèi)部都是以二進制數(shù)的形式存在的。

日常生活中,十進制數(shù)是我們最常用的一種進位計數(shù)制,通過對十進制數(shù)的分析,我們需要明確幾個概念:數(shù)碼:表示某種進位計數(shù)制的一組符號。基數(shù):所使用的數(shù)碼個數(shù)。位權(quán):數(shù)碼在不同數(shù)位上的倍率值。我們舉兩個例子一起看一下位權(quán)。

如十進制數(shù)7879,里面有兩個7,但它們的意義是不同,從右向左數(shù),第二個位置上的7,代表的是70,也就是7*10的1次方,第四個位置上的7,代表的是7000,也就是7*10的3次方。二進制數(shù)1010,也有兩個1,從右向左數(shù),第二個位置上的1,代表的是1*2的1次方,第四個位置上的1,代表的是1*2的3次方。這里的10的幾次方以及2的幾次方,就是進位計數(shù)制不同數(shù)位上的位權(quán)。

雖然計算機內(nèi)部存儲信息時用的都是二進制數(shù),但是由于二進制數(shù)表示時一般數(shù)位會很長,為了解決這個矛盾,人們又引入了十六進制數(shù),十六進制數(shù)有16個基本的數(shù)碼,分別是0-9,以及ABCDEF,這里要注意他們分別對應的數(shù)值。

同時我們還要知道,在計算機存儲信息時,只能是二進制數(shù),十六進制數(shù)并不是一種真實的存在,只是因為它們和二進制數(shù)相互轉(zhuǎn)換時更方便。

接下來,我們了解數(shù)制轉(zhuǎn)換。

“其它”進制轉(zhuǎn)換為十進制,基本方法是“乘權(quán)相加”。

比如10011B轉(zhuǎn)換為十進制數(shù),2FH轉(zhuǎn)換為十進制數(shù)。

“十”進制轉(zhuǎn)換為“其它”進制,基本方法是“除N逆序取余”,我們以35D轉(zhuǎn)換為二進制數(shù)和十六進制數(shù)為例。

“二”轉(zhuǎn)“十六”,基本方法: 把二進制數(shù)從右向左按4位一組劃分,每組用一位十六進制數(shù)表示。我們以1 1 1 0 0 1 1 0 1 0 0 1 0 B轉(zhuǎn)換為二進制數(shù)為例。

“十六”轉(zhuǎn)“二”,基本方法:把十六進制數(shù)從右向左按每一位十六進制數(shù)轉(zhuǎn)化為4位的二進制數(shù),按順序排列即可。注意:除了左邊第一位,后面不足四位的必須用“0”補足四位,并且不能省略。我們以2 A 3 H轉(zhuǎn)換為二進制數(shù)為例。

其實在客觀世界中,我們所感知的實際信息,它們的變化是連續(xù)的,通常稱為“模擬量”,而把實際的物理量用和它對應的數(shù)值表示,是不連續(xù)的、離散的,我們稱為數(shù)字量。信息數(shù)字化的過程也可以稱為是“模擬量”到“數(shù)字量”的過程,一般需要三個步驟:采樣、量化和編碼。

西方字符,字符數(shù)量少,數(shù)字、英文大小寫字母及各類特殊符號,共計128種,所以用7位二進制數(shù)來進行編碼。這種編碼方法,稱為ASCII碼。一個西方字符,用7位二進制數(shù)編碼,存儲時最高位用“0”補足,占用一個字節(jié)。二進制數(shù)位,是最小的存儲單位,簡寫為bit;字節(jié),是最基本存儲單位,寫為Byte,簡寫為大寫的B;也就是說,一個字節(jié)等于8個二進制數(shù)位,比字節(jié)更大的存儲單位還有KB\MB\GB\TB等,它們之間的倍率都是1024,也就是2的10次方。

同學們看這張ASCII碼表,可以發(fā)現(xiàn)阿拉伯數(shù)字以及西方字符,他們都是按照順序排列的。阿拉伯字符和英文字符,它們的ASCII碼是按照順序排列的,順序后移一位,ASCII碼增加1;后移n位,增加n。同時還可以發(fā)現(xiàn),從這張表的左上角到右下角,ASCII碼的值是在逐漸變大的的,在這個表中,越是向后,ASCII碼值越大。所以,就整體來看,“小寫字母>大寫字母>阿拉伯數(shù)字”的ASCII碼。

其實,字符的編碼經(jīng)歷了一系列的標準化過程。

上個世紀60年代,ASCII碼解決了西方字符在計算機中的處理和存儲的問題。之后,中國大陸地區(qū)的漢字編碼也經(jīng)歷了多種標準,我們現(xiàn)在最常使用的是GB18030-2005,它支持多種字節(jié)的漢字編碼,大部分采用雙字節(jié)。當然,在輸入時:有音碼、形碼,在輸出時,可以通過點陣、矢量等方式。隨著互聯(lián)網(wǎng)的全球化進程,世界各個國家都有自己的編碼方案,在一定程度上還是可能產(chǎn)生沖突,所以就出現(xiàn)了Unicode編碼,它統(tǒng)一了不同語言的編碼。又簡稱統(tǒng)一碼或萬國碼。常用的編碼方案有:UTF-8,UTF-16,UTF-32。

可以這樣說,計算機中一切信息都用二進制數(shù)表示,字符編碼是信息處理的基礎。在對它們進行編碼的過程中,經(jīng)歷了一系列的標準化。

標準化并不是信息技術(shù)所獨有的思想方法,只是隨著社會的發(fā)展,信息科技影響著社會生活的方方面面,信息技術(shù)標準既是建設信息化基礎設施、開發(fā)信息系統(tǒng)的依據(jù),也是信息系統(tǒng)之間互聯(lián)互通、彼此兼容的保證。

聲波作為一種模擬量,在對它數(shù)字化的過程中,經(jīng)過采樣和量化、編碼,在計算機中,未經(jīng)壓縮的WAV文件的容量計算方式是:(采樣頻率×量化位數(shù)×聲道)×時間/8,這里的除以8是因為一個字節(jié)相當于8個二進制數(shù)位,同時還要注意:聲道一般只有兩種:單聲道數(shù)值為1;雙聲道數(shù)值為2;立體聲屬于雙聲道;時間的單位,必須轉(zhuǎn)換為:秒。

圖像作為我們常見的一種信息載體,未經(jīng)壓縮的BMP位圖圖像的容量計算方法是:分辨率×位數(shù)/8,黑白圖像的量化位數(shù)為1位;彩色圖像的量化位數(shù)一般為24位,同時還要區(qū)分“多少色”和“位”,比如看到說某圖像為256色,則為8位,這是因為256等于2的8次方。

接下來我們看看壓縮技術(shù)。

數(shù)據(jù)能夠壓縮,前提是因為數(shù)據(jù)存在冗余度。比如這兩個文檔數(shù)據(jù),前一個是一篇《丑小鴨》的完整文檔,后一篇文檔都由一個“小”字組成,我們就可以認為后一篇文檔數(shù)據(jù)冗余度高;同理,對于這兩幅圖片,第一張背景單一,大部分為藍色,后一張背景復雜,我們可以認為第一張圖像的數(shù)據(jù)冗余度高。一般而言,數(shù)據(jù)冗余度高的文件,在相同的數(shù)據(jù)壓縮技術(shù)下,其被壓縮率也高。

數(shù)據(jù)壓縮,分為無損壓縮有損壓縮兩類,其中無損壓縮是指壓縮之后數(shù)據(jù)可以完全恢復原樣。它適合所有各類型的文件,常常要借助WINRAR或WINZIP等軟件實現(xiàn)。而有損壓縮技術(shù)壓縮之后數(shù)據(jù)不能完全恢復原樣,它一般適用于聲音、圖像、視頻等文件。像文檔和程序等文件是不能使用有損壓縮的。

對于有損壓縮,圖像和聲音的常見格式我們也需要了解。圖像文件的未壓縮格式是BMP,典型有損壓縮格式是JPG,聲音文件的未壓縮格式是WAV,典型有損壓縮格式是MP3,視頻文件的未壓縮格式是AVI,典型壓縮格式是MPG,當然對于這三類文件,還有一些常見的有損壓縮格式如圖。

最近幾年來,人工智能、大數(shù)據(jù)是熱詞,相信大家都聽說過,也有人說我們已經(jīng)進入了大數(shù)據(jù)時代,大數(shù)據(jù)已經(jīng)成為社會的一項重要資源。一般來說,大數(shù)據(jù)具備這樣幾個特征,一是數(shù)據(jù)規(guī)模大;二是數(shù)據(jù)類型多,數(shù)據(jù)來源、格式多元,多維度數(shù)據(jù)增加;三是處理速度快,這里主要是指計算機等工具計算能力的提升,處理結(jié)構(gòu)化的海量數(shù)據(jù)速度快。四是價值密度低。

當今時代,通過對大數(shù)據(jù)分析,可以更好的為我們的學習、生活提供幫助。一般來說,大數(shù)據(jù)處理有四個步驟,分別是數(shù)據(jù)采集,目前,我們可以通過很多方式采集數(shù)據(jù),傳感器、射頻識別技術(shù)以及社交網(wǎng)絡媒體等都可以獲得各種類型的海量數(shù)據(jù);二是數(shù)據(jù)預處理,對于采集到的原始數(shù)據(jù),可能存在缺失、遺漏以及邏輯錯誤等,需要進行預處理。三是數(shù)據(jù)分析,我們可以根據(jù)使用數(shù)據(jù)的目的,對數(shù)據(jù)進行可視化處理等,比如這張圖上是我們學校近年來美術(shù)高考成績的分數(shù)分布情況,可以幫助大家更好的認識和規(guī)劃自己的學習生活;四是數(shù)據(jù)挖掘應用,比如這是某地區(qū)出租車用車情況熱點分布圖,對于用戶和出租車司機都有很好的借鑒作用。

工欲善其事,必先利其器。信息技術(shù)的發(fā)展日新月異,我們要想在這個時代更好的生存,學習、掌握一些信息技術(shù)基本知識是很有必要的,讓這些知識內(nèi)化為自己的智慧,成為最好的自己,相信大家都是最棒的。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    国产熟女一区二区三区四区| 91精品国产av一区二区| 国产又色又粗又黄又爽| 国产精品国产亚洲区久久| 邻居人妻人公侵犯人妻视频| 老熟女露脸一二三四区| 美女激情免费在线观看| 亚洲一区二区精品久久av| 日韩欧美综合在线播放| 日本成人三级在线播放| 好吊妞视频这里有精品| 在线观看中文字幕91| 国产不卡的视频在线观看| 国产精品亚洲综合天堂夜夜| 亚洲一区二区三区熟女少妇| 人人爽夜夜爽夜夜爽精品视频| 国产精品第一香蕉视频| 国产精品一区二区视频大全| 国产成人午夜在线视频| 精品香蕉国产一区二区三区| 69老司机精品视频在线观看| 国产精品一区二区三区激情| 国产精品一区欧美二区| 最近最新中文字幕免费| 免费在线观看激情小视频| 亚洲中文字幕乱码亚洲| 欧美韩国日本精品在线| 91免费精品国自产拍偷拍| 国产高清精品福利私拍| 韩国日本欧美国产三级| 六月丁香六月综合缴情| 韩国日本欧美国产三级| 欧美大粗爽一区二区三区| 91亚洲人人在字幕国产| 丝袜破了有美女肉体免费观看| 精品少妇一区二区视频| 国产午夜精品在线免费看| 国产一级内片内射免费看| 欧美日韩精品综合一区| 嫩呦国产一区二区三区av| 亚洲欧美国产中文色妇|