R#语言简明教程

教程

谢桂纲 -

6:20 PM

文章阅读目录大纲

估计阅读时长: 8 分钟

https://github.com/rsharp-lang/R-sharp

R#语言的语法主要来自于R语言，其在保留了很多的R语言特性的同时，也添加了很多新语法特性。对于R#与R语言之间相同的语法特性，在本简明教程中我就不再叙述了，在这里主要是给大家说明一下R#语言相对于R语言新增的一些语法特性。

R#语言中的向量

R#语言任然保持着和其前辈R语言一样的向量化编程的特性。对于声明一个向量，在R语言之中，需要使用c函数进行申明，而对于R#语言而言，除了使用c函数，还可以直接使用方括号进行申明，例如：

x = c("A","B","C")
# x
# [1]     "A" "B" "C"
x = ["A","B","C"]
# x
# [1]     "A" "B" "C"

R#语言中的函数声明

对于R语言而言，函数其实就是一个closure类型的变量，在R之中使用function函数进行closure的申明，并赋值给一个符号。下面就是R的文档中对function函数的帮助信息：

function {base}

Function Definition

Description
These functions provide the base mechanisms for defining new functions in the R language.
Usage
function( arglist ) expr
Arguments

arglist Empty or one or more name or name=expression terms.

expr An expression.
Details
The names in an argument list can be back-quoted non-standard names (see ‘backquote’).

If value is missing, NULL is returned. If it is a single expression, the value of the evaluated expression is returned. (The expression is evaluated as soon as return is called, in the evaluation frame of the function and before any on.exit expression is evaluated.)

If the end of a function is reached without calling return, the value of the last evaluated expression is returned.

但是在R#语言之中，function这个单词将作为一个关键词存在，而函数的申明语法在基本与R保持着一致的同时也添加了一些VisualBasic的语法特性，例如在R#脚本中声明一个函数，可以有下面的语法：

下面的代码是一个申明函数的完整语法，在R#中申明一个函数需要一个符号名称，例如name，然后将这个符号的类型通过以VisualBasic类似的语法申明为一个具有某种功能的函数类型：

let name as function( arglist ) {
    # ...
}

但是在R与R#都是函数式编程语言，在向其他的函数传递函数值类型的函数参数的时候，使用上面的完整语言进行申明参数肯定不方便。所以在R#语言之中还保留着与R语言一样的函数申明方法。但是这个时候在R#之中申明的是一个匿名函数，例如

exec = function(f) print(f())
exec(function() x)
# [1]     "A" "B" "C"

function() x
# declare function '$<$anonymous_01008>'() {
    # function_internal
    # &x;
# }

在R#中执行上面的代码，发现虽然实现的功能与在R语言中是一样的。但是函数的申明的输出却差异很大。产生这个差异的原因就是R#语言将function作为一个关键词，而非像R语言一样作为一个函数名来使用。因为在R#之中，任何对象都要有一个符号名称，对于诸如function() x这样的申明形式，因为没有对应的符号名称，所以R#环境自动为这个值分配了一个匿名符号。

R#语言中的lambda函数

对于使用R#语言进行函数式编程，可以使用上面所提到的匿名函数进行，也可以使用R#语言所特有的lambda函数进行，例如下面的两个函数式编程的操作的效果几乎是一样的(为什么我要在这里特异的强调几乎这个修饰词，lambda函数与匿名函数之间的差异我们将在下面聊)：

exec = function(x, f) print(f(x));
exec(0:4, function(x) x + 1);
# [1]     1 2 3 4 5
exec(0:4, x -> x + 1);
# [1]     1 2 3 4 5

嗯嗯嗯，两者之间的效果确实是几乎一模一样的，那如果是下面的例子呢？

y    = 9;
exec = function(x, f) f(x) + y;

(function() {
    const y = 1;
    print(exec(1, function(x) x + y));
    # [1] 11
})();
(function() {
    const y = 1;
    print(exec(1, x -> x + y));
    # [1] 19
})();

好了，差异看起来非常明显了！为什么会出现这种差异？这是因为呀，匿名函数其是一个closure闭包，closure就意味着匿名函数有自己的上下文environment，因为在匿名函数的上下文中，y符号的值是1，所以最终的结果是：

# (function(x) x + [closure]y) + [global]y
               1 +          1  +         9 = 11

很明显，在匿名函数的例子中，两个y符号是不同的对象；但是对于lambda函数呢？lambda函数其本质上只是一个表达式，不是一个closure闭包，所以lambda函数相对于匿名函数而言，其更加的轻量化，内存负载更低。因为其并不会像匿名函数一样具备有自己的上下文environment，所以其结果为：

# (x -> x + [global]y) + [global]y
        1 +         9  +         9 = 19

但是大家在编写R#脚本的时候，只要是不涉及到闭包上下文环境的切换的情形，lambda函数仍然是可以看作与匿名函数等价的，所以大家任然可以尽情的在lapply或者sapply这类R语言中常用的向量化编程函数中使用lambda函数。

R#语言中的管道符号

在R语言之中，大家可以使用dplyr，或者magrittr包中所提供的%>%操作符实现管道操作。在R#语言之中，大家则可以直接使用一个原生的管道操作符|>，例如：

bitmap(file = logo.png) {
    seq.fasta
    |> read.fasta
    |> MSA.of
    |> plot.seqLogo(title)
    ;
}

R#语言中的字符串插值

在传统的R脚本之中，字符串的插值是通过paste函数来实现的，而在R#语言之中，则可以通过类似于TypeScript语言的字符串插值语法来一步到位的实现，更加的简洁明了，例如：

paste("Hello" , c("word", "world"), "!")
# [1] "Hello word !"  "Hello world !"

# new language feature in R# language
`Hello ${["word", "world"]}!`
# [1] "Hello word!"  "Hello world!"

上面所展示的新的字符串插值语法对比之前的paste函数是不是更加的方便和简洁明了？

R#语言的acceptor语法糖

我们在进行编程的时候，肯定是希望我们的代码可以更加的模块化，所以出现了诸如function之类的概念用于生成代码模块。但是在这里的模块化，是另外的一个概念，其更加的相当于一个功能组。这个功能组的概念在R#语言中为被称作为一种acceptor名字的语法糖，我们来看一个例子吧：

write.csv(file = "/path/to/table.csv") {
    print("blablabla");
    str(x);

    data.frame(a = x, b = TRUE);
}

通过上面的代码我们是不是很清楚的看到，实现某一个功能的代码块都放到了一个结构模块之中，我们的代码思路是不是更加清楚了。如果我们用传统的R脚本来实现上面的过程呢？

print("blablabla");
str(x);

z = data.frame(a = x, b = TRUE);
write.csv(z, file = "/path/to/table.csv");

嗯。。。前半段的print和str函数看起来好像和下面的data.frame没有那么大的关联了。但是实际上我们是希望将上面的print和str与下面的写表格文件的代码归组在一块的。

如何理解R#语言中的acceptor语法糖呢？acceptor语法糖其实就是管道操作的一个变种，如果我们将上面的acceptor语法糖例子分别改写回普通的函数调用或者管道模式，大家应该会非常清楚这个语法糖是怎么一回事了。一般而言，在R语言或者R#语言之中，任意一个代码逻辑块实际上都是一个表达式，所以我们可以编写出诸如下面的代码：

write.csv({
    print("blablabla");
    str(x);

    data.frame(a = x, b = TRUE);
}, file = "/path/to/table.csv");

因为打印数据和生成dataframe的操作这一组表达式都是在一个closure表达式内，构成一个closure表达式的，所以上面所展示的一组操作可以作为一个表达式正常的传递给write.csv函数的第一个参数。上面的写法，我们也可以改写为管道操作样式：

({
    print("blablabla");
    str(x);

    data.frame(a = x, b = TRUE);
}) |> write.csv(file = "/path/to/table.csv");

Author
Recent Posts

谢桂纲

高级数据科学家 at 苏州帕诺米克

Working on Engineered bacteria CAD design on its genome from scratch. Writing scientific computing software for Tianhe & Sunway TaihuLight supercomputer. Do scientific computing programming in R/R# language, he is also the programming language designer of the R# language on the .NET runtime.

Attachments

R_ubuntu-bash • 212 kB • 819 click
2021年6月2日
LexA • 78 kB • 820 click
2021年6月2日

打赏赞(2)

GCModeller language R#scripting

6 Responses

【数据可视化】对ggplot程序包的从头实现 – この中二病に爆焔を！ says:

2021年10月4日 at 12:43 PM

[…] 《R#语言简明教程》 […]

来自中国

Reply
使用R#语言编写一个Http服务器 – この中二病に爆焔を！ says:

2021年8月11日 at 1:04 AM

[…] 关于HTTP协议的基础，可以阅读文章《从零开始手撸一个Web服务器》 R#脚本语言的语法，大家可以阅读这两篇博客做一些初步的学习：《R#语言简明教程》，《R#语法教程之二》 […]

来自中国

Reply
R#语法教程之二 – この中二病に爆焔を！ says:

2021年6月5日 at 10:02 PM

[…] 今天在这里给大家介绍的是一些在R#脚本语言编程之中的一些高级语法，关于R#语言的一些基础语法，大家可以阅读R#语言教程系列的第一篇《R#语言简明教程》 […]

来自中国

Reply
有诺 says:

2021年6月2日 at 9:48 PM

keep on boy

来自北京

Reply
- xie guigang says:
  
  2021年6月3日 at 2:29 AM
  
  好的
  
  来自美国
  
  Reply
Hello R# – この中二病に爆焔を！ says:

2021年6月2日 at 8:04 PM

[…] 《R#语言简明教程》 […]

来自中国

Reply

Leave a Reply to xie guigang Cancel reply

May 2026
S	M	T	W	T	F	S
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

单细胞视角下的微生物基因组代谢酶嵌入分析 – この中二病に爆焔を！ on 基因组功能注释（EC Number）的向量化嵌入2026年2月25日
[…] 我们在基于前面所论述的《通过diamond软件进行blastp搜索》对大规模的基因组数据进行了代谢酶的EC number的注释以及按照文章《基因组功能注释（EC Number）的向量化嵌入》的方法，得到了一个比较大的基因组代谢酶TF-IDF嵌入丰度矩阵后，如果将这里所得到的嵌入结果矩阵中的基因组，基于Family层级的物种分类分组看作为单细胞转录数据中的细胞分群结果，能否基于单细胞数据分析方法来分析和可视化我的基因组功能嵌入的结果矩阵呢？ […]
单细胞视角下的微生物基因组代谢酶嵌入分析 – この中二病に爆焔を！ on 通过diamond软件进行blastp搜索2026年2月25日
[…] 我们在基于前面所论述的《通过diamond软件进行blastp搜索》对大规模的基因组数据进行了代谢酶的EC number的注释以及按照文章《基因组功能注释（EC Number）的向量化嵌入》的方法，得到了一个比较大的基因组代谢酶TF-IDF嵌入丰度矩阵后，如果将这里所得到的嵌入结果矩阵中的基因组，基于Family层级的物种分类分组看作为单细胞转录数据中的细胞分群结果，能否基于单细胞数据分析方法来分析和可视化我的基因组功能嵌入的结果矩阵呢？ […]
基因组代谢酶层级嵌入 – この中二病に爆焔を！ on 酶EC编号结构解析2026年2月23日
[…] 对于基于ec number来生成层级数据，我们直接使用《酶EC编号结构解析》文章末尾所展示的层级数据生成函数来实现。 […]
二叉树聚类可视化微生物群落代谢差异 – この中二病に爆焔を！ on 基因组功能注释（EC Number）的向量化嵌入2026年2月15日
[…] 在前面的一篇《基因组功能注释（EC Number）的向量化嵌入》博客文章中，针对所注释得到的微生物基因组代谢信息，进行基于TF-IDF的向量化嵌入之后。为了可视化向量化嵌入的效果，通过UMAP进行降维，然后基于降维的结果进行散点图可视化。通过散点图可视化可以发现向量化的嵌入结果可以比较好的将不同物种分类来源的微生物基因组区分开来。 […]
谢桂纲 on 通过diamond软件进行blastp搜索2026年2月15日
😲啊？

https://github.com/rsharp-lang/R-sharp

R#语言中的向量

R#语言中的函数声明

Function Definition

R#语言中的lambda函数

R#语言中的管道符号

R#语言中的字符串插值

R#语言的acceptor语法糖

Attachments

Related

6 Responses

Leave a Reply to xie guigang Cancel reply

Recent Posts

Archives

博客文章

R#语言简明教程

https://github.com/rsharp-lang/R-sharp

R#语言中的向量

R#语言中的函数声明

Function Definition

R#语言中的lambda函数

R#语言中的管道符号

R#语言中的字符串插值

R#语言的acceptor语法糖

Order by Date Name Attachments

Related

6 Responses

Leave a Reply to xie guigang Cancel reply

Recent Posts

Archives

博客文章

Tags

Attachments