搜索引擎中单个倒排索引的源程序现在提供下载了。
Wednesday, 13. September 2006, 11:37:24
这个程序整合了分词系统。分词现在做的不够好,只是用了逆向最大配备来切词,昨天随便试了句子,切的结果很不理想,不过现在也就这么将就着,等整个系统都搭好后再来改模块了。
下面提供源程序下载:
密码是:http://my.opera.com/lau_jia/blog
单文件倒排实现.rar
蛙仔
Wednesday, 13. September 2006, 11:37:24
这个程序整合了分词系统。分词现在做的不够好,只是用了逆向最大配备来切词,昨天随便试了句子,切的结果很不理想,不过现在也就这么将就着,等整个系统都搭好后再来改模块了。
Wednesday, 13. September 2006, 11:28:25

Thursday, 24. August 2006, 02:57:14
对程序进行了修正,原来无法查找单词eh的bug被消除(原因是算法里有个bug,已经修正)修正了单个字母无法匹配的bug。这里要感谢我的同学彭侃,是他在软件的使用中发现了这两个bug,以使程序和算法更完善。Wednesday, 23. August 2006, 03:17:23
花了一周的时间终于把论文上的算法实现了,累死Friday, 11. August 2006, 04:43:08
用了几个礼拜,终于把分词系统做好了,我这里提供下载,希望大家支持,如果有bug可以留言。并且本人提供dll库,如果有兴趣可以向我购买.什么是中文分词
众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。我是一个学生,分词的结果是:我 是 一个 学生。
Thursday, 3. August 2006, 05:29:46
在面向对象的语言里面,出现了类的概念。这是编程思想的一种进化。所谓类:是对特定数据的特定操作的集合体。所以说类包含了两个范畴:数据和操作。而C语言中的struct仅仅是数据的集合。
1.实例:下面先从一个小例子看起
#ifndef C_Class
#define C_Class struct
#endif
C_Class A {
C_Class A *A_this;
void (*Foo)(C_Class A *A_this);
int a;
int b;
};
C_Class B{ //B继承了A
C_Class B *B_this; //顺序很重要
void (*Foo)(C_Class B *Bthis); //虚函数
int a;
int b;
int c;
};
void B_F2(C_Class B *Bthis)
{
printf("It is B_Fun\n");
}
void A_Foo(C_Class A *Athis)
{
printf("It is A.a=%d\n",Athis->a);//或者这里
// exit(1);
// printf("纯虚 不允许执行\n");//或者这里
}
void B_Foo(C_Class B *Bthis)
{
printf("It is B.c=%d\n",Bthis->c);
}
void A_Creat(struct A* p)
{
p->Foo=A_Foo;
p->a=1;
p->b=2;
p->A_this=p;
}
void B_Creat(struct B* p)
{
p->Foo=B_Foo;
p->a=11;
p->b=12;
p->c=13;
p->B_this=p;
}
int main(int argc, char* argv[])
{
C_Class A *ma,a;
C_Class B *mb,b;
A_Creat(&a);//实例化
B_Creat(&b);
mb=&b;
ma=&a;
ma=(C_Class A*)mb;//引入多态指针
printf("%d\n",ma->a);//可惜的就是 函数变量没有private
ma->Foo(ma);//多态
a.Foo(&a);//不是多态了
B_F2(&b);//成员函数,因为效率问题不使用函数指针
return 0;
}
输出结果:
11
It is B.c=13
It is A.a=1
It is B_Fun
2.类模拟解说:
我在网上看见过一篇文章讲述了类似的思想(据说C++编程思想上有更加详细的解说,可惜我没空看这个了,如果有知道的人说一说吧)。但是就象C++之父说的:“C++和C是两种语言”。所以不要被他们在语法上的类似就混淆使用,那样有可能会导致一些不可预料的事情发生。
其实我很同意这样的观点,本文的目的也不是想用C模拟C++,用一个语言去模拟另外一个语言是完全没有意义的。我的目的是想解决C语言中,整体框架结构过于分散、以及数据和函数脱节的问题。
C语言的一大问题是结构松散,虽然现在好的大型程序都基本上按照一个功能一个文件的设计方式,但是无法做到更小的颗粒化――原因就在于它的数据和函数的脱节。类和普通的函数集合的最大区别就在于这里。类可以实例化,这样相同的函数就可以对应不同的实例化类的变量。
自然语言的一个特点是概括:比如说表。可以说手表,钟表,秒表等等,这样的描述用面向对象的语言可以说是抽象(继承和多态)。但是我们更要注意到,即使对应于手表这个种类,还是有表链的长度,表盘的颜色等等细节属性,这样细微的属性如果还用抽象,就无法避免类膨胀的问题。所以说类用成员变量来描述这样的属性。这样实例并初始化不同的类,就描述了不同属性的对象。
但是在C语言中,这样做是不可能的(至少语言本身不提供这样的功能)。C语言中,如果各个函数要共享一个变量,必须使用全局变量(一个文件内)。但是全局变量不能再次实例化了。所以通常的办法是定义一个数组。以往C语言在处理这样的问题的时候通常的办法就是这样,比如说socket的号,handel等等其实都是数组的下标。(不同的连接对应不同的号,不同的窗口对应不同的handel,其实这和不同的类有不同的成员变量是一个意思)
个人认为:两种形式(数组和模拟类)并无本质的区别(如果不考虑虚函数的应用的话),它们的唯一区别是:数组的办法将空间申请放在了“模块”内,而类模拟的办法将空间申请留给了外部,可以说就这一点上,类模拟更加灵活。
3.其他的话:
我的上述思想还是很不成熟的,我的目的是想让C语言编程者能够享受面向对象编程的更多乐趣。我们仅仅面对的是浩瀚的“黑箱”,我们的工作是堆砌代码,而且如果要更改代码功能的时候,仅仅换一个黑箱就可以了。
而更大的目的是促使这样的黑箱的产生。或许有一天,一种效率很好,结构很好的语言将会出现。那个时候编程是不是就会象说话一样容易了呢?
Thursday, 3. August 2006, 05:28:55
类模拟中使用了大量的函数指针,结构体等等,有必须对此进行性能分析,以便观察这样的结构对程序的整体性能有什么程度的影响。
1.函数调用的开销
#define COUNTER XX
void testfunc()
{
int i,k=0;
for(i=0;i<YY;i++){k++;}
}
在测试程序里面,我们使用的是一个测试函数,函数体内部可以通过改变YY的值来改变函数的耗时。测试对比是 循环调用XX次函数,和循环XX次函数内部的YY循环。
结果发现,在YY足够小,X足够大的情况下,函数调用耗时成为了主要原因。所以当一个“简单”功能需要“反复”调用的时候,将它编写为函数将会对性能有影响。这个时候可以使用宏,或者inline关键字。
但是,实际上我设置XX=10000000(1千万)的时候,才出现ms级别的耗时,对于非实时操作(UI等等),即使是很慢的cpu(嵌入式10M级别的),也只会在XX=10万的时候出现短暂的函数调用耗时,所以实际上这个是可以忽略的。
2.普通函数调用和函数指针调用的开销
void (*tf)();
tf=testfunc;
测试程序修改为一个使用函数调用,一个使用函数指针调用。测试发现对时间基本没有什么影响。(在第一次编写的时候,发现在函数调用出现耗时的情况下(XX=1亿),函数指针的调用要慢(release版本),调用耗时350:500。后来才发现这个影响是由于将变量申请为全局的原因,全局变量的访问要比局部变量慢很多)。
3.函数指针和指针结构访问的开销
struct a {
void (*tf)();
};
测试程序修改为使用结构的函数指针,测试发现对时间基本没有什么影响。其实使用结构并不会产生影响,因为结构的访问是固定偏移量的。所以结构变量的访问和普通变量的访问对于机器码来说是一样的。
测试结论:使用类模拟的办法对性能不会产生太大的影响。
Thursday, 3. August 2006, 05:28:03
相信很多人都看过设计模式方面的书,大家有什么体会呢?Bridge,Proxy,Factory这些设计模式都是基于抽象类的。使用抽象对象是这里的一个核心。
其实我觉得框架化编程的一个核心问题是抽象,用抽象的对象构建程序的主体框架,这是面向对象编程的普遍思想。用抽象构建骨架,再加上多态就形成了一个完整的程序。由于C++语言本身实现了继承和多态,使用这样的编程理念(理念啥意思?跟个风,嘿嘿)在C++中是十分普遍的现象,可以说Virtual(多态)是VC的灵魂。
但是,使用C语言的我们都快把这个多态忘光光了。我常听见前辈说,类?多态?我们用的是C,把这些忘了吧。很不幸的是,我是一个固执的人。这么好的东西,为啥不用呢。很高兴的,在最近的一些纯C代码中,我看见了C中的多态!下面且听我慢慢道来。
1. VC中的Interface是什么
Interface:中文解释是接口,其实它表示的是一个纯虚类。不过我所要说的是,在VC中的Interface其实就是struct,查找Interface的定义,你可以发现有这样的宏定义:
#Ifndef Interface
#define Interface struct
#endif
而且,实际上在VC中,如果一个类有Virtual的函数,则类里面会有vtable,它实际上是一个虚函数列表。实际上C++是从C发展而来的,它不过是在语言级别上支持了很多新功能,在C语言中,我们也可以使用这样的功能,前提是我们不得不自己实现。
2.C中如何实现纯虚类(我称它为纯虚结构)
比较前面,相信大家已经豁然开朗了。使用struct组合函数指针就可以实现纯虚类。
例子: typedef struct {
void (*Foo1)();
char (*Foo2)();
char* (*Foo3)(char* st);
}MyVirtualInterface;
这样假设我们在主体框架中要使用桥模式。(我们的主类是DoMyAct,接口具体实现类是Act1,Act2)下面我将依次介绍这些“类”。(C中的“类”在前面有说明,这里换了一个,是使用早期的数组的办法)
主类DoMyAct: 主类中含有MyVirtualInterface* m_pInterface; 主类有下函数:
DoMyAct_SetInterface(MyVirtualInterface* pInterface)
{
m_pInterface= pInterface;
}
DoMyAct_Do()
{
if(m_pInterface==NULL) return;
m_pInterface->Foo1();
c=m_pInterface->Foo2();
}
子类Act1:实现虚结构,含有MyVirtualInterface st[MAX]; 有以下函数:
MyVirtualInterface* Act1_CreatInterface()
{
index=FindValid() //对象池或者使用Malloc !应该留在外面申请,实例化
if(index==-1) return NULL;
St[index].Foo1=Act1_Foo1; // Act1_Foo1要在下面具体实现
St[index].Foo2=Act1_Foo2;
St[index].Foo3=Act1_Foo3;
Return &st [index];
}
子类Act2同上。
在main中,假设有一个对象List。List中存贮的是MyVirtualInterface指针,则有:
if( (p= Act1_CreatInterface()) != NULL)
List_AddObject(&List, p); //Add All
While(p=List_GetObject()){
DoMyAct_SetInterface(p);//使用Interface代替了原来大篇幅的Switch Case
DoMyAct_Do();//不要理会具体的什么样的动作,just do it
}
FREE ALL。
在微系统里面,比如嵌入式,通常使用对象池的技术,这个时候可以不用考虑释放的问题(对象池预先没有空间,使用Attach,在某个函数中申请一个数组并临时为对象池分配空间,这样函数结束,对象池就释放了)
但是在Pc环境下,由于程序规模比较大,更重要的是一些特殊的要求,使得对象的生命周期必须延续到申请的那个函数体以外,就不得不使用malloc,实际上即使在C++中,new对象的自动释放始终是一个令人头疼的问题,新的标准引入了智能指针。但是就我个人而言,我觉得将内存释放的问题完全的交给机器是不可信任的,它只能达到准最佳。
你知道设计Java的垃圾回收算法有多困难吗?现实世界是错综复杂的,在没有先验条件下,要想得到精确的结果及其困难。所以我说程序员要时刻将free记在心上,有关程序的健壮性和自我防御将在另外一篇文章中讲述。
3.纯虚结构的退化
下面我们来看看如果struct里面仅仅有一个函数是什么? 这个时候如果我们不使用struct,仅仅使用函数指针又是什么? 我们发现,这样就退化为普通的函数指针的使用了。
所以说,有的时候我觉得面向对象仅仅是一种形式,而不是一种技术。是一种观点,而不是一种算法。但是,正如炭,石墨和钻石的关系一样,虽然分子式都是C,但是组成方法不一样,表现就完全不一样了!
有的时候,我们经常被编程中琐碎的事情所烦恼,而偏离了重心,其实程序可进化的特性是很重要的。有可能,第一次是不成功的,但是只要可进化,就可以发展。
4.进阶――类结构树,父类不是纯虚类的类
前面仅仅讲的是父类是纯虚结构的情况 (面向对象建议的是所有类的基类都是从纯虚类开始的), 那么当类层次比较多的情况下,出现父类不是纯虚结构怎么办呢。嘿嘿,其实在C中的实现比C++要简单多了。因为C中各个函数是分散的。
在这里使用宏定义是一个很好的办法:比如两个类Act1,ActByOther1“继承”Act1:
MyVirtualInterface* ActByOther1_CreatInterface()
{
index=FindValid() //对象池或者使用Malloc
if(index==-1) return NULL;
St[index].Foo1= ActByOther1_Foo1; // Act1_Foo1要在下面具体实现
St[index].Foo2= ActByOther1_Foo2;
St[index].Foo3= ActByOther1_Foo3;
Return &st [index];
}
#define ActByOther1_Foo1 Act1_Foo1 //这就是继承 嘿嘿
ActByOther1_Foo2(){} // 可以修改其实现
ActByOther1_DoByOther() {} //当然就可以添加新的实现咯
5.实例――可以参见H264的源码,其中NalTool就是这样的一个纯虚结构。
Thursday, 3. August 2006, 05:23:07
在面向对象的语言里面,出现了类的概念。这是编程思想的一种进化。所谓类:是对特定数据的特定操作的集合体。所以说类包含了两个范畴:数据和操作。而C语言中的struct仅仅是数据的集合。
1.实例:下面先从一个小例子看起
#ifndef C_Class
#define C_Class struct
#endif
C_Class A {
C_Class A *A_this;
void (*Foo)(C_Class A *A_this);
int a;
int b;
};
C_Class B{ //B继承了A
C_Class B *B_this; //顺序很重要
void (*Foo)(C_Class B *Bthis); //虚函数
int a;
int b;
int c;
};
void B_F2(C_Class B *Bthis)
{
printf("It is B_Fun\n");
}
void A_Foo(C_Class A *Athis)
{
printf("It is A.a=%d\n",Athis->a);//或者这里
// exit(1);
// printf("纯虚 不允许执行\n");//或者这里
}
void B_Foo(C_Class B *Bthis)
{
printf("It is B.c=%d\n",Bthis->c);
}
void A_Creat(struct A* p)
{
p->Foo=A_Foo;
p->a=1;
p->b=2;
p->A_this=p;
}
void B_Creat(struct B* p)
{
p->Foo=B_Foo;
p->a=11;
p->b=12;
p->c=13;
p->B_this=p;
}
int main(int argc, char* argv[])
{
C_Class A *ma,a;
C_Class B *mb,b;
A_Creat(&a);//实例化
B_Creat(&b);
mb=&b;
ma=&a;
ma=(C_Class A*)mb;//引入多态指针
printf("%d\n",ma->a);//可惜的就是 函数变量没有private
ma->Foo(ma);//多态
a.Foo(&a);//不是多态了
B_F2(&b);//成员函数,因为效率问题不使用函数指针
return 0;
}
输出结果:
11
It is B.c=13
It is A.a=1
It is B_Fun
2.类模拟解说:
我在网上看见过一篇文章讲述了类似的思想(据说C++编程思想上有更加详细的解说,可惜我没空看这个了,如果有知道的人说一说吧)。但是就象C++之父说的:“C++和C是两种语言”。所以不要被他们在语法上的类似就混淆使用,那样有可能会导致一些不可预料的事情发生。
其实我很同意这样的观点,本文的目的也不是想用C模拟C++,用一个语言去模拟另外一个语言是完全没有意义的。我的目的是想解决C语言中,整体框架结构过于分散、以及数据和函数脱节的问题。
C语言的一大问题是结构松散,虽然现在好的大型程序都基本上按照一个功能一个文件的设计方式,但是无法做到更小的颗粒化――原因就在于它的数据和函数的脱节。类和普通的函数集合的最大区别就在于这里。类可以实例化,这样相同的函数就可以对应不同的实例化类的变量。
自然语言的一个特点是概括:比如说表。可以说手表,钟表,秒表等等,这样的描述用面向对象的语言可以说是抽象(继承和多态)。但是我们更要注意到,即使对应于手表这个种类,还是有表链的长度,表盘的颜色等等细节属性,这样细微的属性如果还用抽象,就无法避免类膨胀的问题。所以说类用成员变量来描述这样的属性。这样实例并初始化不同的类,就描述了不同属性的对象。
但是在C语言中,这样做是不可能的(至少语言本身不提供这样的功能)。C语言中,如果各个函数要共享一个变量,必须使用全局变量(一个文件内)。但是全局变量不能再次实例化了。所以通常的办法是定义一个数组。以往C语言在处理这样的问题的时候通常的办法就是这样,比如说socket的号,handel等等其实都是数组的下标。(不同的连接对应不同的号,不同的窗口对应不同的handel,其实这和不同的类有不同的成员变量是一个意思)
个人认为:两种形式(数组和模拟类)并无本质的区别(如果不考虑虚函数的应用的话),它们的唯一区别是:数组的办法将空间申请放在了“模块”内,而类模拟的办法将空间申请留给了外部,可以说就这一点上,类模拟更加灵活。
3.其他的话:
我的上述思想还是很不成熟的,我的目的是想让C语言编程者能够享受面向对象编程的更多乐趣。我们仅仅面对的是浩瀚的“黑箱”,我们的工作是堆砌代码,而且如果要更改代码功能的时候,仅仅换一个黑箱就可以了。
而更大的目的是促使这样的黑箱的产生。或许有一天,一种效率很好,结构很好的语言将会出现。那个时候编程是不是就会象说话一样容易了呢?
C语言的多态实现
相信很多人都看过设计模式方面的书,大家有什么体会呢?Bridge,Proxy,Factory这些设计模式都是基于抽象类的。使用抽象对象是这里的一个核心。
其实我觉得框架化编程的一个核心问题是抽象,用抽象的对象构建程序的主体框架,这是面向对象编程的普遍思想。用抽象构建骨架,再加上多态就形成了一个完整的程序。由于C++语言本身实现了继承和多态,使用这样的编程理念(理念啥意思?跟个风,嘿嘿)在C++中是十分普遍的现象,可以说Virtual(多态)是VC的灵魂。
但是,使用C语言的我们都快把这个多态忘光光了。我常听见前辈说,类?多态?我们用的是C,把这些忘了吧。很不幸的是,我是一个固执的人。这么好的东西,为啥不用呢。很高兴的,在最近的一些纯C代码中,我看见了C中的多态!下面且听我慢慢道来。
1. VC中的Interface是什么
Interface:中文解释是接口,其实它表示的是一个纯虚类。不过我所要说的是,在VC中的Interface其实就是struct,查找Interface的定义,你可以发现有这样的宏定义:
#Ifndef Interface
#define Interface struct
#endif
而且,实际上在VC中,如果一个类有Virtual的函数,则类里面会有vtable,它实际上是一个虚函数列表。实际上C++是从C发展而来的,它不过是在语言级别上支持了很多新功能,在C语言中,我们也可以使用这样的功能,前提是我们不得不自己实现。
2.C中如何实现纯虚类(我称它为纯虚结构)
比较前面,相信大家已经豁然开朗了。使用struct组合函数指针就可以实现纯虚类。
例子: typedef struct {
void (*Foo1)();
char (*Foo2)();
char* (*Foo3)(char* st);
}MyVirtualInterface;
这样假设我们在主体框架中要使用桥模式。(我们的主类是DoMyAct,接口具体实现类是Act1,Act2)下面我将依次介绍这些“类”。(C中的“类”在前面有说明,这里换了一个,是使用早期的数组的办法)
主类DoMyAct: 主类中含有MyVirtualInterface* m_pInterface; 主类有下函数:
DoMyAct_SetInterface(MyVirtualInterface* pInterface)
{
m_pInterface= pInterface;
}
DoMyAct_Do()
{
if(m_pInterface==NULL) return;
m_pInterface->Foo1();
c=m_pInterface->Foo2();
}
子类Act1:实现虚结构,含有MyVirtualInterface st[MAX]; 有以下函数:
MyVirtualInterface* Act1_CreatInterface()
{
index=FindValid() //对象池或者使用Malloc !应该留在外面申请,实例化
if(index==-1) return NULL;
St[index].Foo1=Act1_Foo1; // Act1_Foo1要在下面具体实现
St[index].Foo2=Act1_Foo2;
St[index].Foo3=Act1_Foo3;
Return &st [index];
}
子类Act2同上。
在main中,假设有一个对象List。List中存贮的是MyVirtualInterface指针,则有:
if( (p= Act1_CreatInterface()) != NULL)
List_AddObject(&List, p); //Add All
While(p=List_GetObject()){
DoMyAct_SetInterface(p);//使用Interface代替了原来大篇幅的Switch Case
DoMyAct_Do();//不要理会具体的什么样的动作,just do it
}
FREE ALL。
在微系统里面,比如嵌入式,通常使用对象池的技术,这个时候可以不用考虑释放的问题(对象池预先没有空间,使用Attach,在某个函数中申请一个数组并临时为对象池分配空间,这样函数结束,对象池就释放了)
但是在Pc环境下,由于程序规模比较大,更重要的是一些特殊的要求,使得对象的生命周期必须延续到申请的那个函数体以外,就不得不使用malloc,实际上即使在C++中,new对象的自动释放始终是一个令人头疼的问题,新的标准引入了智能指针。但是就我个人而言,我觉得将内存释放的问题完全的交给机器是不可信任的,它只能达到准最佳。
你知道设计Java的垃圾回收算法有多困难吗?现实世界是错综复杂的,在没有先验条件下,要想得到精确的结果及其困难。所以我说程序员要时刻将free记在心上,有关程序的健壮性和自我防御将在另外一篇文章中讲述。
3.纯虚结构的退化
下面我们来看看如果struct里面仅仅有一个函数是什么? 这个时候如果我们不使用struct,仅仅使用函数指针又是什么? 我们发现,这样就退化为普通的函数指针的使用了。
所以说,有的时候我觉得面向对象仅仅是一种形式,而不是一种技术。是一种观点,而不是一种算法。但是,正如炭,石墨和钻石的关系一样,虽然分子式都是C,但是组成方法不一样,表现就完全不一样了!
有的时候,我们经常被编程中琐碎的事情所烦恼,而偏离了重心,其实程序可进化的特性是很重要的。有可能,第一次是不成功的,但是只要可进化,就可以发展。
4.进阶――类结构树,父类不是纯虚类的类
前面仅仅讲的是父类是纯虚结构的情况 (面向对象建议的是所有类的基类都是从纯虚类开始的), 那么当类层次比较多的情况下,出现父类不是纯虚结构怎么办呢。嘿嘿,其实在C中的实现比C++要简单多了。因为C中各个函数是分散的。
在这里使用宏定义是一个很好的办法:比如两个类Act1,ActByOther1“继承”Act1:
MyVirtualInterface* ActByOther1_CreatInterface()
{
index=FindValid() //对象池或者使用Malloc
if(index==-1) return NULL;
St[index].Foo1= ActByOther1_Foo1; // Act1_Foo1要在下面具体实现
St[index].Foo2= ActByOther1_Foo2;
St[index].Foo3= ActByOther1_Foo3;
Return &st [index];
}
#define ActByOther1_Foo1 Act1_Foo1 //这就是继承 嘿嘿
ActByOther1_Foo2(){} // 可以修改其实现
ActByOther1_DoByOther() {} //当然就可以添加新的实现咯
类模拟的性能分析
类模拟中使用了大量的函数指针,结构体等等,有必须对此进行性能分析,以便观察这样的结构对程序的整体性能有什么程度的影响。
1.函数调用的开销
#define COUNTER XX
void testfunc()
{
int i,k=0;
for(i=0;i }
在测试程序里面,我们使用的是一个测试函数,函数体内部可以通过改变YY的值来改变函数的耗时。测试对比是 循环调用XX次函数,和循环XX次函数内部的YY循环。
结果发现,在YY足够小,X足够大的情况下,函数调用耗时成为了主要原因。所以当一个“简单”功能需要“反复”调用的时候,将它编写为函数将会对性能有影响。这个时候可以使用宏,或者inline关键字。
但是,实际上我设置XX=10000000(1千万)的时候,才出现ms级别的耗时,对于非实时操作(UI等等),即使是很慢的cpu(嵌入式10M级别的),也只会在XX=10万的时候出现短暂的函数调用耗时,所以实际上这个是可以忽略的。
2.普通函数调用和函数指针调用的开销
void (*tf)();
tf=testfunc;
测试程序修改为一个使用函数调用,一个使用函数指针调用。测试发现对时间基本没有什么影响。(在第一次编写的时候,发现在函数调用出现耗时的情况下(XX=1亿),函数指针的调用要慢(release版本),调用耗时350:500。后来才发现这个影响是由于将变量申请为全局的原因,全局变量的访问要比局部变量慢很多)。
3.函数指针和指针结构访问的开销
struct a {
void (*tf)();
};
测试程序修改为使用结构的函数指针,测试发现对时间基本没有什么影响。其实使用结构并不会产生影响,因为结构的访问是固定偏移量的。所以结构变量的访问和普通变量的访问对于机器码来说是一样的。
测试结论:使用类模拟的办法对性能不会产生太大的影响。
C语言中的面向对象思想
经常听见别人说面向对象的程序设计,以前在学校上课的时候,也有开面向对象程序设计这门课。可是不幸的是,这些都是以C++,甚至VC++为基础的。而更加不幸的是,多年以来我一直是一个C的使用者。在学校的时候,我主要做的是硬件上的驱动层,和底层功能层。在工作以后,又做的是手机上的软件开发,所有这些都是和C离不开的。虽然我不得不说,C++是一门很好的语言,但是它的编译速度,代码效率,编译后的代码大小都限制了它在嵌入式上的应用。(但现在的嵌入式CPU越来越快,内存容量变大。我觉得用C++也应该没有什么问题。这使我觉得似乎是嵌入式编译器的限制。虽然菲利普和TI好像都有C++的编译器,但是似乎没人用这个。难道是太贵了? 但不管怎么说,嵌入式应用中,C语言的普遍使用是肯定的)
那么在面向过程的时代产生的C语言能否使用面向对象的思想呢?我认为是肯定可以的,C++不过是在语言级别上加入了对对象的支持,同时提供了丰富的对象库。而在C语言下,我们只好自力更生了。
一、 面向对象思想的目的是框架化,手段是抽象
相信很多人都明白面向对象讲了什么:类,抽象类,继承,多态。但是是什么原因促使这些概念的产生呢?
打个比方说:你去买显示器,然而显示器的品牌样式是多种多样的,你在买的过程中发生的事情也是不可预测的。对于这样的事情,我们在程序语言中如何去描述呢。面向对象的思想就是为了解决这样的问题。编写一个程序(甚至说是一个工程),从无到用是困难的,从有到丰富是更加困难的。面向对象将程序的各个行为化为对象,而又用抽象的办法将这些对象归类(抽象),从而将错综复杂的事情简化为几个主要的有机组合(框架化)。
其实我们的身边很多东西都是这样组成的:比如说电脑:电脑是由主板,CPU加上各种卡组成的。这就是一个框架化。而忽略不同的CPU,不同的主板,不同的声卡,网卡,显卡的区别,这就是抽象。再比如说现在的教育网:是由主核心节点:清华,北大,北邮等几个,然后是各个子节点,依次组成了整个教育网网络。
所以我觉得面向对象的编程思想就是:一个大型工程是分层次结构的,每层又由抽象的结构连接为整体(框架化),各个抽象结构之间是彼此独立的,可以独立进化(继承,多态)。层次之间,结构之间各有统一的通讯方式(通常是消息,事件机制)。
二、 以前C语言编程中常用的“面向对象”方法
其实C语言诞生以来,人们就想了很多办法来体现“面向对象”的思想。下面就来说说我所知道的方法。先说一些大家熟悉的东东,慢慢再讲诡异的。呵呵
1. 宏定义:
有的人不禁要问,宏定义怎么扯到这里来了,我们可以先看一个简单的例子:
#define MacroFunction Afunction
然后在程序里面你调用了大量的AFunction,但是有一天,你突然发现你要用BFunction了,(不过AFunction又不能不要,很有可能你以后还要调用),这个时候,你就可以#define MacroFunction Bfunction来达到这样的目的。
当然,不得不说这样的办法是too simple,sometime naïve的,因为一个很滑稽的问题是如果我一般要改为BFunction,一半不变怎么办? 那就只好查找替换了。
2. 静态的入口函数,保证函数名相同,利用标志位调用子函数:
这样的典型应用很多,比如说网卡驱动里面有一个入口函数Nilan(int FunctionCode,Para*)。具体的参数是什么记不清楚了。不过NiLan的主体是这样的:
Long Nilan(int FunctionCode,Para*){
Switch(FunctionCode){
Case SendPacket: send(….)
Case ReceivePacket: receive(…)
…..
}
写到这里大家明白什么意思了吧。保证相同的函数名就是说:网卡驱动是和pNA+协议栈互连的,那么如何保证pNA+协议栈和不同的驱动都兼容呢,一个简单的办法就是仅仅使用一个入口函数。通过改变如果函数的参数值,来调用内部的各个函数。这样的做法是可以进化的:如果以后想调用新的函数,增加相应的函数参数值就好了。如果我们将网卡驱动和pNA+协议栈看作两个层的话,我们可以发现:
层与层之间的互连接口是很小的(这里是一个入口函数),一般是采用名字解析的办法而不是具体的函数调用(利用FunctionCode调用函数,Nilan仅仅实现名字解析的功能)――!接口限制和名字解析
接口限制:层与层之间仅仅知道有限的函数
名字解析:层与层之间建立共同的名字与函数的对应关系,之间利用名字调用功能。
3.CALLBACK函数。
我觉得这是C语言的一个创举,虽然它很简单,就象如何把鸡蛋竖起来一样,但是你如果没想到的话,嘿嘿。如果说静态入口函数实现了一个可管理的宏观的话,CallBack就是实现了一个可进化的微观:它使得一个函数可以在不重新编译的情况下实现功能的添加!但是在最最早期的时候,也有蛮多人持反对态度,因为它用了函数指针。函数指针虽然灵活,但是由于它要访问内存两次才可以调用到函数,第一次访问函数指针,第二次才是真正的函数调用。它的效率是不如普通函数的。但是在一个不太苛刻的环境下,函数调用本身就不怎么耗时,函数指针的性能又不是特别糟糕,使用函数指针其实是一个最好的选择。但是函数指针除了性能,最麻烦的地方就是会导致程序的“支离破碎”。试想:在程序中,你读到一个函数指针的时候,如果你愣是不知道这个函数指针指向的是哪个函数,那个感觉真的很糟糕。(可以看后面的文章,要使用先进的程序框架,避免这样的情况)
三、 Event和Message
看了上面的描述,相信大家多少有些明白为什么要使用Event和Message了。具体的函数调用会带来很多的问题(虽然从效率上讲,这样做是很好的)。为了提高程序的灵活性,Event和Message的办法产生了。用名字解析的办法代替通常的函数调用,这样,如果双方对这样的解析是一致的话,就可以达到一个统一。不过Event和Message的作用还不仅仅是如此。
Event和Message还有建立进程间通信的功能。进程将自己的消息发给“控制中心”(简单的就是一个消息队列,和一个while循环不断的取消息队列的内容并执行),控制程序得到消息,分发给相应的进程,这样其他进程就可以得到这个消息并进行响应。
Event和Message是很灵活的,因为你可以随时添加或者关闭一个进程,(仅仅需要添加分发消息的列表就可以了)Event和Message从程序实现上将我觉得是一样的,只不过概念不同。Event多用于指一个动作,比如硬件发生了什么事情,需要调用一个什么函数等等。Message多用于指一个指示,比如什么程序发生了什么操作命令等等。
四、 小结
其实编程序和写文章一样,都是先有一个提纲,然后慢慢的丰富。先抽象化得到程序的骨架,然后再考虑各个方面的其他内容:程序极端的时候会发生什么问题?程序的这个地方的功能现在还不完善,以后再完善会有什么问题?程序是不是可以扩展的?
本系列文章是我这些阶段的一些心得,目的是抛砖引玉,希望能和大家交流,得到更多的知识。Liyuming1978@163.com (这个信箱以前发了一个文章 C优化之路,现在都快成垃圾信箱了,呵呵,网络的力量真是强大呀)
Monday, 31. July 2006, 09:22:22
fseek函数是 用来设定文件的当前读写位置.
函数原型: int fseek(FILE *fp,long offset,int origin);
函数功能:把fp的文件读写位置指针移到指定的位置.
fseek(fp,20,SEEK_SET); 意思是把fp文件读写位置指针从文件开始后移20个字节.
ftell函数是用来获取文件的当前读写位置;
函数原型: long ftell(FILE *fp)
函数功能:得到流式文件的当前读写位置,其返回值是当前读写位置偏离文件头部的字节数.
ban=ftell(fp); 是获取fp指定的文件的当前读写位置,并将其值传给变量ban.
fseek函数与ftell函数综合应用:
分析:可以用fseek函数把位置指针移到文件尾,再用ftell函数获得这时位置指针距文件头的字节数,这个字节数就是文件的长度.#include <stdio.h> main() { FILE *fp; char filename[80]; long length; printf("输入文件名:"); gets(filename); //以二进制读文件方式打开文件 fp=fopen(filename,"rb"); if(fp==NULL) printf("file not found!\n"); else { //把文件的位置指针移到文件尾 fseek(fp,OL,SEEK_END); //获取文件长度; length=ftell(fp); printf("该文件的长度为%1d字节\n",length); fclose(fp); } }
Showing posts 1 - 10 of 13.
| S | M | T | W | T | F | S |
|---|---|---|---|---|---|---|
|
| ||||||
| 1 | 2 | 3 | 4 | 5 | ||
| 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 13 | 14 | 15 | 16 | 17 | 18 | 19 |
| 20 | 21 | 22 | 23 | 24 | 25 | 26 |
| 27 | 28 | 29 | 30 | 31 | ||
My Opera in China has been a real pain for over a year. At times, I can post but not download a picture. I'm taking a chance and posting today without the pics in hopes to update friends and family on what's going on. We now have 18 children, but don't panic several are going for adoption before th ...
We are in the midst of a transition at Swallow's Nest. The children were moved Friday the 13th at noon by me and all four workers. We took them to our university home on the 5th floor of another building about a 10 minute taxi ride from you ai lu. The painters have finished their work but we want t ...
Yesterday, we added another little 2 and a half year old to Swallow's Nest. Her Special Need is deafness. You always hope maybe its not true, but last night she had the ultimate hearing test. All the children went to bed fairly well and were quiet by 9 pm. The older girls whispered until about 9:45 ...
When older children first come to Swallow's Nest, they show very little emotion. Then, after a few days or a week, they are happy, happy, happy. Next, (and the Dora Memory game usually brings it out) they begin to feel......the good, the bad, and the ugly. Last night, we're playing the memory game. ...
Every now and then, I'll spot something that reminds me of days gone by. Last week, it was the holihocks in the field at our school. I love these flowers. They're not my favorite but the memories are sweet. My grandmother used to plant them on the edge of her vegetable garden. She'd have a row or t ...
搜索引擎早已经成为互联网上的最大的应用之一了,可是新闻媒体已经研究人员很难拿到相关的数据来对它进行深入的研究。之所以不知庐山真面目,只缘看不到真正的有价值的数据及其分析。 在搜索引擎领域,用户的搜索意图分析是一个关键领域,主要研究的方向是用户输入的关键词的真正意图。就拿最常见的搜索关键词:木乃伊3 下载,这个搜索的意图非常明显,用户就是要找到能下载木乃伊3的一个网址。另外例如像n73这样的搜索词,就是一个手机的型号,可以补全到nokia n73。 用户的搜索意图的分析的方法相对不固定,比较成功的有中心词分析、历史搜索关键词、语义分析、语境分析、点击统计分析等手段。那么互联网上的用户在搜索引擎上 ...
云计算这个新名词最近甚嚣尘上,最近周围不少朋友都在谈,有必要写一个关于云计算的科普了。 一般的业界比较喜欢用一些新名词来体现自己的战略眼光和与对手的区隔。当几个月前google提出云计算的概念的时候,amazon说自己做的事情就是云计算,IBM、intel、sun都声称自己在云计算领域有深刻的计划。只可惜大家听了半天仍然不知道什么是云计算,依旧云里雾里知道这个与计算有关,干脆就叫“云计算”吧。 到底云计算是什么呢? 这个问题不好回答,专业一点的回答是:云计算是依靠强大的计算能力,使得成千上万的终端用户不担心所使用的计算技术和接入的方式等都能够进行有效的依靠网络连接起来的硬件平台的计算能力来 ...
最近行色匆匆,春天的杭州无比的绿。 很久没有参加会议了,这次www2008刚好在北京召开,忍不住要去看看,毕竟我去年没有怎么关注技术,需要补课的时候到了。 参加周四和周五的会议,周四主要集中在多媒体和数据挖掘,周五集中在移动和新技术上。 没有参加周三的社区为主的会议是因为国外的社区和中国的社区差别太大,也许意义不大。 会议的安排虽然很丰富,可惜一个人只能物理上出现在一个会场,怀念当年和文心在美国参加South by Southwest 时候分别到不同的会场听会议,晚上再各自交流的年代。...
从北京来杭州已经3个月了,在淘宝网的短短的三个月里,见证了淘宝的高速成长,在这样一个安静和绿色的城市里,淘宝网和它的5000万的会员迎来了2008。 这里在发生这什么呢? 1. 搜索 也许很少的人知道淘宝是中文网站里面除了百度最大的搜索引擎,而实际上淘宝的搜索却是要求更高,更加准确的搜索。数以亿计的商品在货架上,而这些商品每时每刻都在上架、下架、价格在调整。这一切要求淘宝的搜索要及时和准确,每一次搜索和后一秒的同样的搜索的结果都会因为商品的价格和上下架而不一样。淘宝的搜索每天处理着大约3亿次以上的请求,创造着数亿的交易额。 2. 分布式计算 这是一个交易型网站,每天处理着数百万级别的商品图片和 ...
我们这代人很幸运,也很无奈,幸运在于我们处在一个知识大爆炸的年代,新的知识层出不穷,我们每个人的知识可能能够跟那些历史的伟人像牛顿、伽利略等比肩,无奈的是正是因为知识大爆炸,这些知识的更新的速度也加快,知识的更新速度有时已经不是用年来计算了,而是以月来计算了。记得我大学的时候学习的高级计算机语言是pascal,上机实习用的是IMB的PC/xt,几年后这种计算机就销声匿迹了。等到我本科毕业开始做论文的时候,已经用上了486,至于之前准备的一堆的5寸盘,都已经成了历史的证据。在最近的几年这种趋势呈加速发展的趋势,新的互联网应用和互联网产品每时每刻都在更新,每天都有新的应用产生。这些新的知识和新的应 ...
åç§°ï¼ Silverlight Books ç®ä»ï¼Silverlight çå¼ååèèµæãä¹¦ç± ç»§ç» . Related: Adobe CEO questions Microsoft Silverlight cross-platform commitment - 20 April 2007 Will Silverlight be a Flash killer? - 23 April 2007 Silverlight sparks anti-trust concerns - 18 Octobe ...
⢠AMD èååå§äºº Ed Turney å èçå»ä¸ ⢠Star Trek XI åå¸é¦æ¹å§ç § ⢠Build Your Own 3D Movie Clips In A Flash With Xtranormal ⢠Window Extractor Extracts Embedded Videos and Windows â¢ å¨æ°ä¼¦èªæä¸ä¹ æ¯ç©¿å 裤 ⢠Ghaith Abdul-Ahad visits the impoverished camps ...
è½ç¶åªæ¯å¾ççæ¶é´ï¼ä½æ¯å¨ Dell ç宿¹ç½ç«ä¸ï¼çç¡®åºç°äº Inspiron Mini 12 ç 宿¹å®è£ æå å ç»´æ¤æå ãèå¨ä¸ä¹ åï¼åç³»åç Mini 9 æåååå¸ï¼æä½ç³»ç»å¯ä»¥éæ© Ubuntu Linux æè Windows XPãèè¿ä¸æ¬¡ç Mini 12 çæä½ç³»ç»å ...
åç§°ï¼ Vidified ç®ä»ï¼å¨çº¿ç个æ§åè§é¢å¶ä½å·¥å · ç»§ç» . Related: Punishment, Self-Interest, and Cooperation - Why the Altruism of Web2.0 Doesn't Exist - 07 April 2006 Web 2.0 : a domainname is not enough - 05 July 2006 Vox - BloggingPlusMore - 19 July 2006 Web 2.1: ...
⢠H-P Making Touch Screen Laptop ⢠Five reasons for more worry at Yahoo ⢠AskAboutCollege: Know Before You Go ⢠DrinkGuru ⢠DealPocket.com - Free Deals, Coupons, Rebates, Travel Deals ⢠Will Smith æ°çµå½± Seven Pounds é¢åç ⢠ç士为é¶è¡æ³¨èµå å®é¶è¡èµæ¬ ⢠微 ...
I'm well peed off! I just wrote a really good blog (if I do say so myself) about Vampire Weekend and then after pressing "preview post" the bloody computer froze on me and then all my open pages disappeared. I'm so peed off I don't feel like writing the blog again so that will have to wait till late ...
Last year around this time Woody finished her first year of teaching and was very sad about losing her babies. I sympathised but thought she was maybe being a bit soppy. For the past month and a bit I've been doing voluntary work mainly with Woodys reception class, gradually changing from two days ...
I F***ing love this! It's Sharleen Spiteri but you can tell it's a Bernard Butler production as well with that gorgeous string arrangement.
We moved back home after house sitting at my folks for a month last Monday night. I spent a few daytime days here during that month and hated being in this pokey dreary little flat again. However as soon as Woody and George the cat moved in with me on Monday the place felt instantly like home aga ...
你这个进化不完全的生命体,基因突变的外星人, 幼稚园程度的高中生,先天蒙古症的青蛙头, 圣母峰雪人的弃婴,化粪池堵塞的凶手, 非洲人搞上黑猪的後裔,阴阳失调的黑猩猩, 被诺亚方舟压过的河马,新火山喷发口, 超大无耻传声扩音喇叭,爱斯基摩人的耻辱, 和蟑螂共存活的超个体,生命力腐烂的半植物, 会发出臭味的垃圾人,"唾弃"名词的源头, 每天退化三次的恐龙,人类历史上最强的废材, 上帝失手摔下来的旧洗衣机,能思考的无脑袋生物, 损毁亚洲同胞名声的祸害,祖先为之蒙羞的子孙, 沉积千年的腐植质,科学家也不敢研究 ……
Butt 这个字除了当作 "屁股" 来解释外, 还有许多非常有趣的口语和俚语用法, 这些可是一般书上学不到的喔~ 1. Can you get your butt down here ? 能不能麻烦你下来一下?Butt 表现出一种尖酸刻薄的语气, 有点那么不耐烦, 不高兴. 比如你找一个住五楼的朋友, 结果到了楼下, 他却跟你说, Come up here. 这时你心里一定会想, "那你你自己不会下来啊?" 像这样的语气, 你就可以说, Can you get your butt down here?在电影 Outside Providence 里, 有一个女生去找她男朋友, 那个男的就叫她自 ...
1. I don't want to be the third wheel. 我不想�����襞�. 一般的自行��都只有二����子, 要是有三����子呢? ……
1. If you can't do better than that, go back to your room . 如果你不能表现的好一点的话, 你就回房去.我同学有一个小女儿, 约二岁左右的年纪. 这个年龄的小孩可真是皮的很. 她妈妈每次都是这样教训她, If you can't do bettr than that, you .... 这样的句子可以用在许多场合, 例如她吃饭时食物掉的满地都是, 或是她跟其他小朋友玩的时候吵起来的, 都可以这么跟她说. 2. Behave . 规矩点.这句话日常生活中常用到. 比如说有人吃完饭就拿袖子擦嘴, 你就可以这么跟他说, Hey! behave ...
1. I can smell a rat. 我觉得事有蹊跷.十二生肖英语让我们先从老鼠 rat 谈起. 所谓 smell the rat 就是说你觉得有些事情不对劲, 但一下子又想不起来倒底是哪里有问题. 例如有人跟你说有一个工作月入十万, 工作轻松. 这种事你相信吗? 当然不, 这时你就可以说, I smell the rat. 有时候这句话也可以用在比较轻松的场合, 比如你看到有一男一女二人常走在一起, 言谈之间又似乎十分亲热. 你怀疑说他们二个人倒底是不是一对? ……