核心内容摘要
www.17.com:开启你精彩无限的数字新篇章
编程语言核心结构体系从相似性到本质理解前言在接触过多个编程语言的学习之后观察到一些通用的范式结构编程语言虽然表面差异巨大但底层存在一套不可简化的最小完备集——这是所有语言都必须包含的基本元素否则无法表达任意算法。
而把握住这一点之后对任意编程语言的学习都有一种脉络极其明晰的感觉一旦了解到这种通用范式的结构那么对于入门编程语言就会有一个系统性的学习认知框架知道该学什么从哪里开始学。
这种通用的范式结构就是所有编程语言共有的基础元素这种相似性源于计算机科学的基本原理——所有编程语言本质上都是人与计算机沟通的抽象工具需要遵循计算机底层执行逻辑的约束。
正是这样的约束导致了编程语言在设计时所共同遵守的某种规则也就是那些隐藏在各种语法表面之下的共性规律。
也因为是讲解共性的内容所以只会涉及到有哪些共性不会描述这些共性在具体语言中是怎么表示的内容。
基础要素任何编程语言都像一座建筑需要最基础的材料和结构。
这些基础元素是表达程序逻辑的基本单元它们共同构成了编程语言的基础框架包括如下五个部分/* by
hk - online tools website :
hk/zh/post.html */ 数据表示/* by
hk - online tools website :
hk/zh/post.html */ 表达式与运算控制结构抽象机制输入输出机制下面按顺序进行介绍。
数据表示任何计算都涉及数据必须有表示数据的方式就像是在草稿本上求解数学题一样特别是代数内容有字母、计算符号以及数值这些写在本子上的字符是表达这些内容的具体形式并且可以保证每个学习过代数的人都可以看懂和理解因为是一套相同的机制。
变量首先要介绍的是变量那么为什么要有变量呢想象一下在代数中如果没有变量只有常量也就是具体的数值那么所有的问题都只是数值计算问题而且是必须一次性完成的计算不可能分步骤迭代式的计算。
同时在实际情况中就是有求解未知量的需求也有某些量在动态变化的情况所以单纯的常量无法建构一个复杂且动态的数学世界对编程而言也同样如此。
在程序中变量的作用如下所示临时保存数据用于分步计算避免一次性大量计算避免直接使用常量因为在一个表达式中常量是无法修改的假设定义一个穿了增高鞋的人的身高函数为f(x)x2其中变量x表示这个人的实际身高而整数常量2就表示增高鞋的高度是固定的数值如果它只穿同一个增高鞋的话这个函数没有问题但是哪天他换了其他高度的鞋子这个2就不适用了难道要为每个鞋子定义一个专属的函数吗这显然不可能。
但是又不知道鞋子具体能给他提供多少身高所以这时候就换用变量a来描述f(x)xa此时这个变量a就代指了增高鞋的高度根据实际鞋子的增高功能同步变化灵活度就更高了。
记录程序运行状态不同于临时保存数据只是某一计算的中间过程此处的运行状态可以调控程序的流程和效果根据输入变化行为提供了与外界交互的可能因为输入是不确定的只有变量才能描述这种不确定性隐藏内存细节因为变量本质上是内存中存储数据的位置代称否则需要直接操作内存地址可读性非常差下面给一个关于代数中的变量与程序中的变量的对比代数编程相同点变量表示未知数或可变的量本质上是内存中存储数据的位置代称或者说一个容器的名字
两者都是符号代表值
都可以被重新赋值
都遵循先定义后使用的原则有一个常见的混淆点就是符号在数学中表示的是一种等价关系只是一种逻辑关系、比如x5表示的是x等于5这样一个关系或事实表述而在程序中表示的是一个动作即赋值也可以形象的表述为把一个值放入进一个容器中具体来说就是把数值5放入到名为x的容器中这个x也称为变量。
作为对比现在有表达式xx1如果从数学的角度来看这个等价关系是不成立的但是从程序的角度来看就是取出容器x的值加一后再放回去的意思。
小结一下可以认为变量就是一种容器当然也有其它类型的容器既然是容器那么就是可重复利用的同时所有语言都必须提供将数据存储在内存中并可通过名称引用的机制这是计算的前提后面的内容表述中容器就是变量的意思。
标识符上一小节介绍了变量也提到变量就是容器但这些都是抽象的概念也就是说给你一些看起来一模一样的容器然后拿一个小球随机放进一个容器中并打乱容器的摆放顺序你还能找到小球在哪个容器中吗很难对吧但是如果给每个容器标识一个唯一的名字那么只要记住小球放入哪个名字标识的容器就可以了因为此时容器是可识别的。
实际上只要标识符能唯一确定某个容器并不会关心标识符由什么组成但现实是程序的标识符需要遵循一些规范比如不能以数字开头、不能包含特殊字符等。
此外还有一类编程语言独有的预定义标识符也称为关键字这些标识符是不可使用的比如python中的input、print内置函数名。
数据/值既然有了容器(变量)那么总要往容器里面放入一些东西对于程序而言就是数据也可以称为值而把数据放入变量这种容器的动作就是赋值操作。
数据有很多种类型比如日常在excel中有文本类型的数据、有数值类型的数据还有一些复合类型的数据这是因为数据来源于多种形式的活动中。
其中文本类型的数据可能是公司的员工姓名、数值类型的数据可能是员工的薪资、复合类型的数据可能是员工其他信息的组合。
在数学中数字有整数、小数复数等类型同样在程序中的数据类型也有多种比如数值类型(整数浮点数)、布尔类型(真/假)和字符串类型等。
之所以有这些数据类型就是要定义数据的性质以及不同类型的处理方式既可以是同类型之间的运算比如32是两个整数之间的运算也可以是不同类型之间的运算比如
3
5中一个是整数另一个是小数定义它们之间的运算方式为把整数转换为小数之后再与另一个小数进行计算。
表达式与运算没有运算就无法计算所有语言都支持将值通过运算符组合成新值而这种由变量、常量和运算符组合的形式就是表达式比如x 5 * 3和数学中的形式很像并且一般情况下运算符的语义也是相通的。
这样的表达式称为算术表达式可以包含变量和常量也可以通过小括号改变运算顺序但是不同于数学中这样的表达式只表示关系在程序中这样的表达式会实际计算值也就是有一个算术结果并且乘号不能省略。
接下来是比较与逻辑运算比如数学中x 5表示变量与数值的关系是这样一个事实陈述x大于5在程序中这样的表达式称为布尔表达式会产生一个布尔值(真/假)。
要记住只要是值就可以赋值给变量比如is_greater x 5那么如果x5则变量is_greater保存的结果就为一个逻辑真值在python中就是true否则为一个逻辑假值false一般布尔表达式用于条件判断比如if条件判断。
控制结构控制流就是逻辑的表达基本控制结构有下表所示元素本质作用说明顺序执行默认执行方式语句按顺序依次执行条件分支根据条件选择路径必须支持if或等价机制循环/迭代重复执行代码块必须支持while或等价机制跳转/返回改变执行位置体现思维的跳跃如return、break其中顺序执行图示如下graph TD A[开始] -- B[步骤1] B -- C[步骤2] C -- D[结束]按照规定好的工序一步步顺序执行不完成步骤1就不会执行到步骤2就比如洗完澡穿衣服正常的顺序应该是先穿内衣再穿外衣也就是步骤1是穿内衣步骤2是穿外衣排除不穿内衣的情况那么应该没人会先执行步骤2穿外衣再执行步骤1穿内衣吧不会吧不会吧条件分支图示如下graph TD Start([开始]) -- Condition{条件判断} Condition --|True| ProcessA[执行操作A] Condition --|False| ProcessB[执行操作B] ProcessA -- End([结束]) ProcessB -- End一个逻辑判断只会产生两个结果不是真就是假比如你今天下班买菜了吗这个逻辑判断要么买了要么没买所以对应到图上只会产生两条支路如果买菜了那么就执行操作A可以是自己做晚饭如果没买菜那么执行操作B可以是点外卖循环结构图示如下graph TD Start([开始]) -- Init[初始化计数器] Init -- Condition{判断循环条件} subgraph 循环体 Process[执行循环操作] Update[更新计数器] end Condition --|满足条件| Process Process -- Update Update -- Condition Condition --|不满足条件| End([结束])循环可以理解为就是重复比如你计划一个长达1年的早起习惯养成目标那么对应到图上循环条件就是不满365天也就是还在习惯养成过程中。
然后循环体中就是要执行早起这个动作并且累计早起天数从开始早起的第一天算起后面每天早起都增加天数直到超过365天这时候就恭喜完成1年的目标啦对于跳转和返回这类非顺序的控制流关键在于打破默认的从上至下的执行顺序但一般用在循环的结束条件和函数上下文切换中其他地方不推荐使用比如goto语句因为属于逻辑跳跃不利于理解。
其次是所有图灵完备语言都必须支持条件判断和循环或等价的递归这是表达任意算法的必要条件抽象机制没有抽象就无法管理复杂度从本质上讲抽象就是信息隐藏——将复杂的内部实现封装起来只对外提供必要的操作接口。
这就像驾驶汽车你只需要知道油门、刹车、方向盘而不需要了解发动机如何工作、变速箱如何换挡。
在程序中基础的抽象的形式主要有函数/过程类与对象。
函数/过程什么是函数呢本质上是将一段完成特定任务的代码封装成一个独立的、可复用的单元通过定义输入参数和输出返回值来隐藏内部实现细节。
它是最基础、最核心的编程抽象机制。
通过这种方式我们可以将复杂系统分解为易于理解和管理的小模块所有实用语言都提供将代码组织成可复用单元的机制否则无法编写大型程序。
形象的理解函数可以认为函数就是一台机器排除额外的改造之外每台机器都有各自的功能这是在机器诞生之日起就固定下来了比如吸尘器顾名思义就是吸入灰尘的。
也就是说吸尘器的输入是灰尘灰尘经过吸尘器之后会有一个输出一团聚集的灰尘这是机器的理想工作状态那如果输入纸巾呢好像也勉强能接收吧可能有的机器处理的不是很好吧但如果输入砖头呢应该没有哪个吸尘器能干这个事情吧。
所以一台机器的输入是有规定的虽然它的输入是不受机器自身控制而来源于外部但是如果想要正常使用机器的功能那么就不能由着自己的性子想输入什么就输入什么同样的对于输出而言这是机器本身固定的部分吸尘器不能把灰尘变成黄金同时对于输入是砖头时吸尘器也不知道该输出什么它直接罢工不干了。
总结下来函数的核心作用如下所示代码复用一次定义多次使用可维护性修改一处即可可读性函数名表达意图错误排查错误集中在函数内那么该怎么使用函数呢首先就是定义的问题也就是确定函数的作用、函数的输入以及函数的输出即函数名、参数以及返回值。
作为对比可以和数学中的函数定义进行比较数学思维编程思维函数是一种映射关系从定义域映射到值域函数是一个可执行过程会实际计算出结果函数的输入来自于定义域函数的参数有类型约束函数的输出来自于值域函数的返回值也有类型约束需要注意的是需要区分函数的定义与调用也就是先有定义才可以调用比如先有函数f(x)2x才会有f(
2*x4这个计算过程。
输入输出机制没有I/O的程序无法与外界交互日常中我们能感知到的输入输出机制就是在使用手机的过程中比如刷手机时手指滑动屏幕会切换到下一个视频。
此时输入就是手指滑动这个动作输出就是手机屏幕做切换视频的动作这就是一种与用户交互的方式可以很直观的被用户感知到。
所有实用语言都提供与外部世界交互的途径否则程序的作用就被限制在计算机内部。
除了这种显式的交互方式还有就是隐藏在系统内部发生的输入输出过程这里涉及到多层级的过程对于用户而言输入和输出都在最外层。
这个过程就像食品加工过程一样比如水果罐头的加工过程如下图所示graph TD %% 输入源 水果原料[ 水果原料] -- 原料准备 %% 第一层原料准备 subgraph 第一层_原料准备 原料准备[原料预处理br输入: 水果原料br输出: 洁净果块] -- 装罐[装罐与糖水灌注br输入: 洁净果块 糖水br输出: 半成品罐头] end %% 第二层密封杀菌 subgraph 第二层_密封杀菌 装罐 -- 密封杀菌[密封与杀菌br输入: 半成品罐头br输出: 杀菌罐头] end %% 第三层成品处理 subgraph 第三层_成品处理 密封杀菌 -- 冷却包装[冷却与包装br输入: 杀菌罐头br输出: 包装成品] end %% 最终输出 冷却包装 -- 成品[ 整果罐头成品] %% 样式设置 style 第一层_原料准备 fill:#fff3e0,stroke:#ef6c00,stroke-width:2px style 第二层_密封杀菌 fill:#f3e5f5,stroke:#8e24aa,stroke-width:2px style 第三层_成品处理 fill:#e8f5e8,stroke:#2e7d32,stroke-width:2px style 水果原料 fill:#ffccbc,stroke:#d84315,stroke-width:2px style 成品 fill:#c8e6c9,stroke:#388e3c,stroke-width:3px输入输出关系标注规则如下所示输入当前工序接收的物料/半成品输出当前工序处理后产生的物料/半成品每个工序框内都明确标注了输入和输出内容箭头方向表示物料流向即上一工序的输出是下一工序的输入对比到app的登陆验证过程中用户输入密码-app内部做验证-返回验证结果对于用户而言内部怎么做验证是不需要关心的只要密码正确就应该登录进账户密码错误就应该无法进入账户。
而对于app而言它不会直接接收到用户的输入用户的输入直接给到了键盘这中间还有操作系统的工作app只是接收了某一过程的输出作为输入。
同样对于验证结果而言用户能看到的只有屏幕但是屏幕绝不会做验证密码的事情实际上app输出的验证结果也不是直接给到屏幕作为输入的这个验证结果也要经过操作系统的底层操作输出给屏幕然后屏幕再输出给用户显示结果。
在学习编程时都会想要看到反馈的结果一个普遍的做法是把结果或其他信息输出到屏幕上比如python的print函数就可以输出信息到屏幕比如print(读取文件失败)这一语句就表示程序想要读取某个文件但是读取失败了。
那么接下来可以就为啥会读取失败这个问题有针对性的调试代码了这种信息就是调试信息。
而这个print函数其实并不能直接驱动屏幕它只是触发了驱动屏幕的开关给了下一层级一个输入也就是哪个调试信息文本整个流程就和上面介绍的水果罐头加工过程一样涉及到底层I/O操作。
总结经过以上内容的介绍我们知道在学习新语言时就应该先把握住如下重点它如何表示数据变量、值如何声明变量和赋值有哪些数据类型它如何进行计算运算符、表达式有哪些基本运算符算术、比较、逻辑它如何控制流程条件、循环如何写条件语句if或等价形式如何写循环while/for或等价形式它如何封装代码函数、作用域如何定义和调用函数它如何与外界交互I/O如何读取输入和输出结果一旦对编程语言的认知框架形成基本就掌握了使用这个编程语言的能力处理一些简单问题是完全足够的。
在理解语言共性时应关注功能等价性而非语法相似性。
例如Python的缩进和C的花括号都是表达代码块的方式本质相同。
这种透过语法看语义的视角才能真正把握编程语言的共性规律。
加油吧每个初学编程的朋友。
微信公众号软趴趴的工程师原文链接本文来自博客园作者pie_thn转载请注明原文链接https://www.cnblogs.com/pie-o/p/19571670