司馬遷在《史記》中記載瞭周幽王“烽火戲諸侯”的故事,這本為記錄周幽王的昏庸:為博褒姒一笑,舉烽火而戲諸侯。文中描述的“幽王為烽燧大鼓,有寇至則舉烽火”卻從側面記錄瞭古人通過烽火臺的烽火和擂鼓的鼓聲來傳遞軍情的辦法。這反映我們祖先很早就掌握瞭通信的方法——通過某種行為或媒介來實現信息的傳遞。
圖1 周幽王烽火戲諸侯,引自http://www.jianshu.com/p/31b436b3c645
當沒有敵人時,烽火臺沒有動靜,現世安穩;當敵人來犯時,在烽火臺上點燃“燃料”,通過燃燒時產生的火光和煙霧將敵人來犯的消息傳遞給下一個烽火臺,下一個烽火臺再傳給下一個烽火臺,烽火臺一個接一個的點下去,敵人來犯的消息就被很快的傳遞出去。用狼煙傳遞信息的原理簡單明瞭,但如果我們要深入理解這一過程的物理學和數學原理,則並沒有想象中的那麼簡單。實際上,直到兩千多年後的20世紀40年代,克勞德·艾爾伍德·香農(Claude Elwood Shannon,1916年4月30日—2001年2月24日)發表瞭《通訊的數學原理》和《噪聲下的通信》兩篇論文後,才為通信和信息理論打下瞭堅實的理論基礎。
烽火臺要實現信息的遠距離傳遞,就需要一個能傳遞信息的載體。如果用“看到狼煙”來表示敵人來犯,人們看到的實際是被狼煙吸收、折射和反射的光線。在沒有月光的黑夜人們是看不到狼煙的,因為要看到狼煙,首先要有照射到狼煙上的光線。光線成為瞭信息傳遞的載體,被狼煙改變的光線成為瞭“信號”。信號通常以某種物理量的方式呈現,信號的傳遞過程就是這一物理量的運動變化和傳播過程。信號即為信息的載體。狼煙將環境光變成攜帶信息的光線的過程即為信息的“加載”。如何在信號中加載信息是通信技術研究的核心問題。
c6924ab3ad721e2eaf159b7e18b6e376圖2 用於傳播消息的電磁波信號,引自http://en.wikipedia.org/wiki/Radio_wave
當一個衛兵看到狼煙時,他需要把這個重要的軍事情報匯報給他的上級,他可以當面用語言報告,也可以把情報寫在紙或者竹簡上報告。實際上我們真正關心是加載在信號載體上的“消息”,而不是信號。同一條消息,我們既可以用光波信號來傳遞,也可以用聲波信號來傳遞,也可以用文字和圖像來傳遞。消息才是目的,信號隻是手段。
“消息”是指用於傳送信息任務的符號或符號序列。人們通常使用文本、數據、語言、圖形和圖像來傳遞消息。通過消息的定義,我們可以知道,接收者要接收到消息,必須要知道發送者使用的符號規則。如果一位中國古代士兵要將“敵人進攻”的消息告知一位語言不通的古羅馬軍官,將是一件難以完成的任務。古羅馬軍官可以收到中國士兵發出的聲音信號,但無法接收到他發出的消息。這說明信號和消息是兩個不同的概念。對於信號,我們關心的是信號傳播的速度、傳播的介質、所需的能量;對於消息,我們關心的是構造消息的效率,即如何在保證通信質量的前提下,盡可能用更少的符號和更高的效率來表示消息。為什麼很多通信系統都使用電磁波信號來傳遞消息?是因為電磁波具有傳播速度快,能在真空和空氣介質中傳播,發射消耗能量要求低等優點。我們日常生活交流中最習以為常又不可或缺是我們的語言。使用同一種語言的人們采用統一的消息表達方式來實現溝通交流,簡潔明瞭、言簡意賅則是語言天生的要求。
是否“消息”就是“信息”呢?按照香農的理解:信息是對不確定性的消除和下降。我們可以從這個定義出發,做一些思考:一名事先不知道敵人入侵的士兵看到瞭烽火臺上的狼煙,他便收到瞭敵人入侵的消息,這一消息顯然消除瞭這個士兵在“敵人是否要入侵我們”這個問題上的不確定性,他收到的消息具有信息量;但如果這個士兵就是點燃狼煙的人,他看到狼煙時,並沒有獲得信息量,因為他在點燃狼煙前就已經知道敵人入侵瞭。這告訴我們兩個結論:
1)消息不是信息。消息雖然不是一個實物,但它通常是對具體事物狀態的描述,具有更多的“客觀性”特征。而信息則與消息描述的具體事物無關,信息用於衡量具體事件中“不確定”性這一抽象概念。
2)同一個消息,對於不同的接收者,信息量是不同的,所以信息不僅和消息有關,還和消息的接收者有關。信息更多表現為多個不確定事件之間的一種關系。
圖3 生活中的不確定性例子,圖片引自網絡
如果能夠對“不確定性”進行定量表示,也就能對信息進行定量表示。在討論信息的定量計算前,我們先舉兩個熟悉的例子。第一個例子是“拋硬幣”,它有兩個可能的結果,如果假設兩個結果出現的可能性相同,各有1/2的可能性。其不確定性就是2選1的可能。第二個例子是“擲骰子”,它有6種可能的結果,如果假設所有結果出現的可能性相同,則各有1/6的可能性。這兩個例子中,顯然第二種情況的不確定性更大,信息量也應該更大。香農在他論文中寫道“如果事件的所有可能性都相等,則信息量H應該是事件可能數量n的單調函數”,即6大於2,則6選1的信息量應該大於2選1的信息量。
香農還寫道“如果一項選擇被分解為兩個連續的選擇,則原來的信息量H應該等於分解後的各個信息量H的加權和”。這句話需要舉一個例子來理解,我們可以分兩步來選擇“擲骰子”的結果,我們先選擇結果是在“1、2、3”或者“4、5、6”中的一種,這顯然是個2選1的問題,可以用數學公式(1)來表示2選1的信息量。
H(frac{1}{2},frac{1}{2}) (1)
公式(1)的括號裡面的兩個1/2代表有兩種可能結果,以及每個結果的可能性均為1/2。可能性之和等於為1,1代表100%實現,即事件結果一定是這兩種選擇中的一種。顯然公式(1)所表示的信息量和拋硬幣是相同的。但我們僅僅選擇瞭結果屬於“1、2、3”或者“4、5、6”中的一種,還沒有選擇骰子的具體點數,這就需要我們再進行一次3選1的選擇,香農定義瞭將這兩次信息量加起來計算總信息量,其中第二次選擇采取瞭加權求和,計算方法如公式(2)所示。
H(frac{1}{2} ,frac{1}{2} )+frac{1}{2} H(frac{1}{3} ,frac{1}{3},frac{1}{3})+frac{1}{2} H(frac{1}{3},frac{1}{3},frac{1}{3}) (2)
按照香農的定義,將6選1問題分解為第一次的2選1問題和第二次的兩個3選1問題得到的信息量和直接進行6選1的信息量應該相等,
H(frac{1}{6},frac{1}{6},frac{1}{6},frac{1}{6},frac{1}{6},frac{1}{6})=H(frac{1}{2},frac{1}{2})+frac{1}{2}H(frac{1}{3},frac{1}{3},frac{1}{3})+frac{1}{2}H(frac{1}{3},frac{1}{3},frac{1}{3}) (3)
要滿足這個要求,我們可以證明信息的定量計算方法如公式(4)所示。
H=-sum_{k=1}^{n}{p_{k}logp_{k}} (4)
我們將公式(4)的對數log()取2為底,表示為lb(),單位為“比特”,可以計算出公式(1)的信息量為1比特。
H(frac{1}{2},frac{1}{2})=-(frac{1}{2} lbfrac{1}{2}+frac{1}{2}lbfrac{1}{2} )=lb2=1
公式(3)的信息量為2.6比特。
H(frac{1}{6},frac{1}{6},frac{1}{6},frac{1}{6},frac{1}{6},frac{1}{6})=lb6≈2.6 bit
即1個比特的二進制符號可以表示硬幣的兩面,2.6比特二進制符號可以表示骰子的6個結果。
表1:用0和1分別代表拋硬幣的兩個選項
拋硬幣結果 | 字面 | 花面 |
1比特二進制 | 0 | 1 |
通信中的信號、消息、信息的基本原理並不僅僅服務於通信系統的技術,而是我們認識客觀世界的基本規律。我們所在的宇宙,任何事物及其運動都可以看作是“物質、能量和信息”的轉換與傳遞。瞭解瞭通信中的信號、消息和信息,有助於我們更深刻地認識信息交換過程的基本原理,也可以指導我們在生活中如何尋找最合適的信號,構造最高效的消息,傳遞最有價值的信息。