单片机技术网|技术阅读
登录|注册

您现在的位置是:单片机技术网 > 技术阅读 > 秀得起飞!C语言里嵌点"机器码"玩一玩"

秀得起飞!C语言里嵌点"机器码"玩一玩"

大家好,我是情报小哥!今天分享一篇C语言运行机器码的文章,代码不难不过能够学到很多嵌入式的底层知识和嵌入式C的运行机制。


1、数电与程序的运行

学习嵌入式的各位朋友都知道有两门必修基础课程就是《数字电路》和《模拟电路》,学完以后基本上就开始学习《微机原理》了,这里简单说说对这三者的理解吧。我们的生活在一个模拟信号的世界,比如声音什么的都是连续的信号,对连续信号一般都会使用模拟电路对信号进行初步处理,而人类的思维更趋向于数字逻辑,所以会使用模数转换对信号进行进一步描述。就拿我们用仪器测量长度,理论上永远无法精确的测量到被测物体的长度到底是多少,而我们所得到的数值都是在一定的误差之内进行表达的,所以数字信号仅仅只是模拟信号一个简化表达,为了让人类更好的认识自然界,这里画个图吧,方便大家理解。

在数字电路中最典型的就是译码器等等,微机就是由非常多这种不同功能的数字电路组合形成的集合体。之前的文章也说过,最终高级代码会转成"0101"机器码供微机读取运行,那么这些机器码就相当于数字信号来触发微机一系列的运行来完成人类的思维逻辑,从而达到控制真实环境的目的。难道随便给个"0101信号"数字电路都可以执行动作吗?答案肯定是不可以的。正所谓无规矩不成方圆,下面再具体跟大家聊聊。

2、汇编、指令集和机器码

比较早期的项目都是用汇编进行程序设计的,现在大部分人面对那些老项目的汇编工程简直要疯狂,不过随着用户需求的不断增加汇编语言的开发速度、代码的可移植性、可读性等都难以满足要求,这样便有了高级语言的出现,包括现在的C++/JAVA等等,现在的高级语言都会编译成汇编文件,汇编文件经过汇编器然后链接成我们的可执行文件汇编语句最典型的就是MOV指令了,可以认为是最简单的汇编指令吧,基本上大部分指令集都会包含有对应的MOV指令,每条汇编指令都会对应着相应的机器码,可以说汇编指令就是为了标记机器码让我们大家能够识别,不然直接读机器码真的是太难了。前面说过机器码相当于数字信号来触发微机系统一系列数字电路的动作,从而完成对应的功能。不同的汇编指令-->不同的机器码-->不同的数字信号-->不同的数字电路功能-->完成对应的工作;那么所有的汇编指令的集合就构成了指令集。不同的芯片一般有着不同的指令集,一般芯片功能比较复杂相应的指令集也会变得复杂。(配个图)

3、C程序嵌入机器码实现过程

    

好了,前面都是为后面进行的铺垫,这里正式开始今天的主题,大部分小伙伴应该对C语言里面嵌入汇编语言了解得比较多,比如nop语句,或者是_asm_("汇编指令");等等形式,不过在C中嵌入机器码的可能见得不多,因为也没有必要,毕竟弄逆向的小伙伴也不多。这里主要是为了让大家更加进一步了解C语言和底层的关系以及程序的运行方式等等,所以拿这个进行讲解:


1)获得程序机器码 

本例子我们是在Dev_C++5.7环境中编译一个加法程序并生成对应的exe可执行文件,参考代码如下:(再简单不过了!)


  • #include <stdio.h>

  • #include <stdlib.h>

  • /**********************************

  • * Fuction: main

  • * Author :(公众号:最后一个bug)

  • **********************************/

  • int main(int argc, char*argv[]) {


  • int a = Myadd(1,2);

  • printf("%X\n",Myadd);

  • printf("公众号:最后一个bug!\n");

  • return0;

  • }

  • /**********************************

  • * Fuction: Myadd

  • * Author :(公众号:最后一个bug)

  • **********************************/

  • intMyadd(int a ,int b)

  • {

  • return(a + b);

  • }


  • 把生成的exe文件进行反汇编获得获得对应的机器码(注意:exe文件不仅仅全是程序的运行的机器码还包括一些程序信息,大家可以查阅相关资料)。上面分别是"内存地址|机器码|对应的汇编语句",可以看到call调用了0X004016FD地址处的myadd加法函数;该函数具体实现如下图所示:这样中间这一列就是对应的程序机器码了。哈哈,下一步我们就嵌入到C语言程序运行。

    2)C程序运行我们的机器码 

    大部分朋友应该学习过函数指针,那么函数名其实就是对应的函数所在地址,只需要把上面的机器码放到我们的内存中,然后使用call指令进行运行岂不就可以运行对应的机器码myAdd函数了?好,那么就实验一下:(还是在Dev_C++环境)


  • #include <stdio.h>

  • constunsignedchar uBinCode[] = {

  • 0x55,

  • 0x89,0xE5,

  • 0x8B,0x45,0x0C,

  • 0x8B,0x55,0x08,

  • 0x01,0xD0,

  • 0x5D,

  • 0xC3,

  • };

  • /**********************************

  • * Fuction: main

  • * Author :(公众号:最后一个bug)

  • **********************************/

  • int main(int argc, char*argv[]) {


  • printf("1 + 1 = %d\n",((int(*)(int,int))uBinCode)(1,1));

  • printf("5 + 5 = %d\n",((int(*)(int,int))uBinCode)(5,5));

  • printf("公众号:最后一个bug!\n");

  • return0;

  • }


  • 解析一下 : 把机器码变成byte放入到了数组中,为什么放入数组中?大家可以思考下,这样数组名就代表着这块数据的首地址,然后强制类型转化为函数指针便可以执行对应的机器码了。程序的运行结果如下:



    4、最后小结

    看到这里很多朋友应该对机器码还有C语言运行有了一个更加深刻的认识吧,里面有一些小小的思考是值得大家推敲一下,大家有时间可以实验一下。

    小哥搜集了一些嵌入式学习资料,公众号内回复"1024"即可获得下载链接!

    推荐好文  点击蓝色字体即可跳转


    ☞ 

    ☞ 

    ☞ 

    ☞ 

    ☞ 


    长按右侧二维码

    即可获取更多精彩内容

    公众号 : 嵌入式情报局