星期日, 11月 09, 2014

C pointer to function 函式指標 學習心得



這是函式指標學習心得的第一篇,在這一篇中你會學習到:

1. 函式在記憶體中的情況
2. 如何宣告一個函式指標
3. 函式的宣告
4. 使用 typedef 來定義一個函式指標的類型

本篇著重在介紹函式指標,實際應用方面會在下一篇介紹

------------------------ 1. 
函式在記憶體中的情況 ------------------------

在真正的開始學習函式指標 ( pointer to function ) 之前,我們要先弄懂到底什麼是函式以及函式在記憶體分布的情形。

當一個程式碼檔案 ( .c , .cpp ...) 被執行的時候,會產生出一個程序 ( process ),此時才會開始佔用記憶體及進行各種運算。先前我們定義的指標都是針對一個資料型態,如:int * 這是一個指向 int 資料類型的指標。然而,C為什麼沒有為 function 也定義出一個資料型別?因為不同的 function 依照建立的方式不同而有不同的 type ,所以沒辦法替每一種 function 都定義出一個通用的型別。

實際上,function 和一般的資料儲存的狀況不太一樣,他儲存的是一堆的指令。
我們可以參考下面的圖片: 
圖片來源:http://ccckmit.wikidot.com/cp%3Aenvironment


當一個 process 產生的時候,會有一塊自己可以使用的記憶體,並且這個記憶體分成許多不同的區塊,儲存不同的東西。一般來說,我們使用的區域變數是儲存在 stack 區段。程式碼則是儲存在 .text 區。因此,雖然和一般的資料型式不同,但是程式碼也是會佔用記憶體的!理所當然,他也會有自己的位址。

我們可以利用反組譯的方式來查看:

編譯方式:gcc -g -o test test.c

在這裡我使用 gdb 來輔助 
第 1 行 顯示 function name 的位址,接著我們到第15行可以發現,function 第 1 行指令的位址和function name的位址是一樣的,所以我們可以得知:其實function name的位址就是function第一行指令的位址。接著,在第 8 行中,我們可以看到main呼叫函式也是利用函式第 1 行指令的位址。

由此可知,其實在function在記憶體中也是有特定儲存的位址。
如果我們在linux的環境中使用 objdump 這個指令可以看得更清楚,他會指名在.text區
Disassembly of section .text:
        .....
        .....
000000000040052d <say_hello>:


------------------------ 2. 如何宣告一個函式指標 ------------------------

宣告方式: return_type (*func_pointer)( parameter list );
例如: 

第8行宣告一個指標名為 fptr ,指向 int (int, int)
換句話說,fptr的type : int (*)(int, int)

我們可以用以下兩種方式將已知的function, assign 給 function pointer:

1. fptr = &func_name;
2. fptr = func_name;

使用的時候也有兩種方法可以使用:

1. (*fptr)(num1, num2);
2. fptr(num1, num2);

每次讀到這一段的時候,總是有個疑惑:為什麼兩種方法都可以?
甚至,你編譯下面這一段 code 也可以執行:

Why? 

要確保初值化(initialization)或是assignment的正確性,取決於 1.數值 2.型別 
舉例來說:
int func(int, int);
int (*fptr)(int, int);

type of fptr is : int (*)(int, int);
type of func is : int (int, int);
type if &func is : int (*)(int , int);

所以 fptr = &func 很合理,型別正確並且數值也正確(&func數值和func一樣)
可是 fptr = func 型別不一樣。 所以在這裡其實做了implicit conversion 
將function name ( i.e. function designator )轉成函式指標使用

至於,使用的方式有兩種一種用deference(i.e use * operator),一種不用
我曾經在一本書上看到這樣的解釋:

在使用function的時候,fun(),其中()稱作 function-call operator
function-call operator 只允許 pointer to function使用。

所以一般我們在使用func_name(); 其實會做implicit conversion將func_name轉型
所以我們這樣寫其實也可以執行(&func_name)();

以上就是 function pointer 的基本操作。

------------------------ 3. 函式的宣告 ------------------------

不知道大家有沒有想過一個問題:

我們在宣告變數的時候,都是依循這樣的形式 : type var_name;
為什麼宣告function是 : return_type func_name( parameter list );

其實我們的看法應該是這樣 func_name( parameter list) 這一整個和var_name對照
所以,我們在gdb中檢查 func_name( parameter list) 這整個東西的type會和return type是一樣的。

在gdb中要查看變數的type可以使用:ptype var_name / whatis var_name 

利用先前的例子:         
(gdb) ptype say_hello  
type = void ()         
(gdb) ptype say_hello()
type = void            
(gdb) ptype &say_hello 
type = void (*)()      


------------------- 4. 使用 typedef 來定義一個函式指標的類型 ---------------

每次我們要宣告一個 function pointer 假如都要照之前那樣寫,對大多數人來說其實不太容易看。更甚者,牽扯到一堆轉型的時候更讓人頭暈目眩。

因此我們利用typedef來定義一個function pointer的type

int (*ptr)(int, int);  // declare a pointer to function : ptr
                       // and its type is : int (*)(int, int)

typedef int (*func_t)(int, int);
這個時候,func_t 就是一個 int(*)(int, int)的型別了

這個語法可能讓人感到confuse,因為以前我們定義的方式很單純:
typedef int bool;
在這裡我會這樣看 (*func_t)(int, int)是一個東西,然後藉由
typedef int (*func_t)(int, int);來間接定義func_t

所以,以後我們就可以這樣寫了:

謝謝觀看,如果有寫的不清楚或是有謬誤的地方還請各界先賢不吝賜教
感謝!


reference : 
1. http://www.newty.de/fpt/index.html
2. linux C 一站式編程
3. google 大神








星期六, 11月 01, 2014

C 語言 指標 學習心得



我個人用指標到現在,覺得指標的用處 :
1 . 修改外部變量
2 . 增加傳遞變數的效率實際上是copy位址值給 function

學習指標的時候要注意:
1.我們要更改的變數他的type是什麼? 
2.要更改的變數他的指標的type是什麼?
心中一定要一直反問這兩句話

初學者可以理解成這樣:
*****指標變數的內容是儲存位址******
*****一般變數的內容是儲存值value *****


以下我會使用 scope 的概念來幫助解說

簡單而言,以 C language 為例子,大括號之間就是一個 scope

在括號之內的東西,到最後一個括號,生命週期就結束了

像是你在  while loop 宣告int變數num 

這個 num 出了 } 之後就沒辦法再使用了

所以 function 才會有return value 去取得 function scope 裡面的值

為什麼要用指標才可以在function內改到 caller(call function的地方)變數的值?

我們可以這樣看 :


func 被 call 了時候 其實在 {} 內是這樣做

所以func結束之後n1就不見,無法在取得

所以假如我們不使用指標,而用下列的方法傳遞參數
其實是在func 內實際上先做了這樣的事情 :
可是假如我們改成

傳入變數的位置 (指標變數的內容是 指到的變數 的位址

fun內:

藉由這個方法

我們才可以真正存取到外面的變數 (因為知道複製外面變數的位址給 num )
ex : 0x12345678 之類

否則只是在自己scope ( 中文叫做作用域 ) 操作

所以才會有指標這種東西。由此可見,指標有一種功能:更改外部變數內容

指標另一個功能是方便傳遞變數

—————————-—————————-—————————- 小結 —————————-—————————-—————————- 


利用 func 更改 main 中 int type 的變數 


//這裡的int *整個是一個 type 代表int指標 指標內容是位址



實際上的動作:

—————————-—————————-指標的第二個用途:傳遞大量數據—————————-—————————-——

當我們定義一個 


我們要把這種struct student( 整個是一個type ) 的變數傳入給function

也是用 “複製“的概念傳入 ( pass by value )

那我們在開始執行function之前 就要整整複製100個元素 這是很沒有效率的行為

所以,我們假如不要這樣做就可以傳入指標

這樣就會傳入 struct student 的第一個位址

在32位元系統中,傳 address 只是複製 4bytes的資料 比之前 100 * 4 bytes 要小
在64位元系統,是複製64位元的資料(一串位址 ex: 0x12345678 87654321) 到function變數中,這個方法就是pass by address


不過其實你會發現到 我在說 pass by address 也用了 “ 複製 ” 這個名詞
所以他其實也是一種pass by value只不過這個value是變數的位置而非變數的數值

因此弄清楚這個觀念之後,其實pass by value , pass by address 其實都只是複製一個 data 到 function裡面只是複製的資訊不同,造成修改的權限不同而已

在電腦實際操作只是 copy value 到 function 裡面

pass by value , pass by address 是人為定義的名詞,但是定義得十分巧妙
文章一開頭曾說過,我們在學習指標的時候要一直反問兩個問題:
1.我們要更改的變數他的type是什麼? 
2.要更改的變數他的指標的type是什麼?

因為我們要用function更改不是在function scope的資料,必須用pass by address的方式傳入變數。也就是我們要將 資料的位址 傳給function,在function中藉由索引到那個位址中存放的內容來間接存取數值,使用的方式就是 *address (dereference)


—————————- 比較 string 傳入和 普通 array 傳入 —————————- 

我們在傳入 char * 的時候,都需要跟 function 說明 array 的大小,

所以實際上傳 array 我們在function的第二個參數要指名大小

但是在傳 C string 時不用,是因為他會去搜尋第一個碰到的 '\0' 做為結尾
因此你在使用 string.h header file 裡面的函數都不用特別指名size大小。

———————————————————————— 結論 —————-—————————-————————


funcition 要改到外部的變數的值則要傳入外部變數的位址
同時,function 接收到的變數,其type要和外部變數的位址相符

ex :

我們要利用function修改一個 type 為 int 的變數:int_num 
要傳入 int_num 的位址給 function :


function  接收變數的 type 要和 接收的資料 互相 match 
所以是這樣宣告的 :


———————————————————————— 問題 ————————————————————————

所以假設今天我們要用function修改一個外面的變數 他的 type  是FILE *

ex:


arg1, type1要怎麼填呢?

arg1 : &f , FILE *是 f 的 type 實際上變數名稱是 f,要讓 function 修改 f 要傳入 f 的位址也就是 &f 

type1 因為接收到 f 的位址 所以type是 FILE* *var_name 分開*是因為:
現在我們告一個指向 FILE * 的指標(*) 
如同指向int 的指標我們宣告為 int *int_pointer;
所以指向FILE *的指標 我們宣告為 FILE * *var_name 只是我們通常會把**寫在一起 : FILE **var_name


如果不幸的我們將function寫成下面的情況會發生什麼事情?

在function內只是先這樣做


———————————————————————— 常見範例 ————————————————————————

剛學指標的時候,老師一定會要我們想怎麼寫一個swap function去交換兩個變數的內容


[Paper note] Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games

Paper:  https://arxiv.org/abs/1703.10069 這篇論文是由 Alibaba & UCL共同發表的,並投稿到 NIPS 2017。他們發表了一個 Multi-agent framework 讓 agents 利用共同的 framew...