语言形式是什么意思?
先放结论,个人理解语言的形式指的是该语言的所有词汇按照一定的规则进行排布组合,以表达概念和抽象概念,进行交际的能力。 举一个通俗的例子,英语的I am是一个句子,am是一个动词,I 是主语,这个句子的形式就是符合英文的语序的。反过来把I 拿掉,剩下的am是动词短语,这个动词短语就是这个单词组的“形式”。同理可证,汉语里我是一句话,我是主语,是表示情感的动词,这个“是我”的形式可以变成“人家说这话是真的吗?”。这里面的“人家人说这话真的是吗?”就是这个词语序列的形式。
接着分析,语言的形式其实包含了几层含义: 一个是语法上的,即某个语句是否合乎语法,这是机器翻译目前所能做的最好的地方之一,因为机器的算法本身很先进; 另一个是语义上的,也就是这个词语序列所表达的概念内容是什么,这往往是人工智能在研究的问题,比如通过词向量的方法计算两个句子或者两个段落的意思差异(这里是指自然语言情况下); 最后才是语用上的,也就是在不同情况下不同的句子应该是什么样的,这就是自然语言处理中的问题,包括机器翻译、文字校对、中文分词等。
当然,语言形式的最小单位是词语,语序、虚词等等都是语言形式的内容。