HolyC 编程语言 - 测试版
Terry A. Davis 的 HolyC 语言实现
U0 Main()
{
"Hello world\n";
}
Main;
完整的语言文档可以在这里找到:https://holyc-lang.com/
简介
这是一个从零开始用 C 语言构建的 HolyC 编译器。目前它是非优化的,直接遍历 AST 并将其编译成 x86_64 汇编代码文本,然后传递给 gcc 进行汇编。支持浮点运算以及大多数主要语言特性。
示例
以下是一段代码片段,展示了这个 HolyC 编译器支持的一些特性。主要包括继承、循环、使用字符串的 printf
以及循环。编译器支持所有类 C 的控制流。
class SomethingWithAnAge
{
I64 age;
};
class Person : SomethingWithAnAge
{
U8 name[1<<5];
};
U0 ExampleFunction(U0)
{
Person *p = MAlloc(sizeof(Person));
MemCpy(p->name,"Bob",3);
p->age = 0;
while (p->age < 42) {
p->age++;
}
"name: %s, age: %d\n",p->name,p->age;
Free(p);
}
ExampleFunction;
兼容性
目前,这个 HolyC 编译器可以将 HolyC 源代码编译成兼容 x86_64 的二进制文件,已在 AMD Linux 和 Intel Mac 上进行了测试。因此,大多数 x86_64
架构应该都支持。创建带有一些优化的 IR
并编译到 ARM
是高优先级的待办事项。
构建
运行 make
,然后运行 make install
(在 Linux 上需要 sudo make install
),这将安装编译器和 HolyC 库,包括字符串、哈希表、I/O、数学、网络、JSON 解析等库... 详见 ./src/holyc-lib/
使用编译器
编译器编译完成后,可以使用以下选项,可以通过运行 hcc --help
显示这些选项:
HolyC 编译器 2024. 不稳定版
hcc [..选项] <..文件>
选项:
-ast 打印 AST 并退出
-tokens 打印标记并退出
-S 仅生成汇编代码
-obj 生成目标文件
-lib 生成动态和静态库
-clibs 链接 C 库,如:-clibs=`-lSDL2 -lxml2 -lcurl...`
-o 输出文件名:hcc -o <名称> ./<文件>.HC
-run 立即运行文件(非 JIT)
-g 未实现
-D<变量> 设置编译器 #define(不接受值)
--help 打印此消息
差异
auto
关键字用于类型推断,这是一个额外的特性,使代码编写更容易。cast<类型>
可用于类型转换,也可以使用后缀类型转换。- 允许在循环中使用
break
和continue
。 - 您可以通过声明原型
extern "c" <类型> <函数名>
来调用任何 libc 代码。然后像平常一样调用函数。示例请参见这里。
错误
这是一个非详尽的错误列表,如果您发现任何问题,请开启一个 issue 或提交 pull request。我打算在有时间时修复这些问题。
- 使用
%f
格式化浮点数不起作用 - 编译器的内存管理几乎不存在,目前所有标记都在编译前生成,这非常慢。
- 错误消息中的行号有时不准确,并且不报告文件
- 参数列表中的函数指针必须放在最后
- 所有可变参数都通过栈传递
I32
和I64
之间的类型转换非常有问题,最明显的是用I32
调用期望I64
的函数,反之亦然,这常常会导致段错误。因此,对于整数类型,最好使用I64
。#define
的预处理器目前只能接受数值表达式和字符串。它不像 C 编译器的预处理器。
灵感与资源:
很多汇编代码是通过运行 gcc -S -O0 <文件>
或 clang -s O0 <文件>
拼凑而成的。这对学习汇编很有效,玩 TempleOS 也是如此。以下是我在学习过程中发现特别有用的编译器和资源的非详尽列表。
想问问题?
在 Twitch 上找我:https://www.twitch.tv/Jamesbarford