1. 为什么需要数据库

如果使用csv file而不使用数据库

1.1 数据一致性

分析了使用csv file来存储数据，可以看出我们迫切需要数据库和DBMS。DBMS(Database Management System)是允许应用程序在数据库中存储和分析信息的软件，而广义的DBMS被设计来定义、创建、查询、更新和管理数据库，这也是该课程的项目所要做的东西。

data model是指如何组织数据的高层次概念。

Scheme是关于存储数据时所使用的定义，其是指使用给定数据模型对特定数据集合的描述。

数据模型应当独立于查询语句。

论文：《A Relational Model of Data for Large Shared Data Banks》

Select：选择满足条件的子集
Projection：生成一个新的输出关系，它里面只包含一个来自我们给定输入关系中的指定属性
Union：将两个关系组合生成一个新的关系，这其中包含了这两个关系中的全部tuple
Intersection：生成一个包含了在两个关系中都出现过的tuple的输出关系
Difference：只取在一个关系中出现的元素，而不取另一个关系中的元素
Product：笛卡尔积，生成两个输入关系中所有tuple的可能组合
Join：自然连接，对于一个关系中的每一个tuple，观察它与另一个关系是否具有相同名称，相同类型的所有属性匹配，如果有，那么这就是这两个关系共同拥有的元素，那么就可以进行连接操作（将对应的tuple连接起来，去除掉一份相同的部分）。要注意的是，该操作符和difference很像但是有区别，difference取的两个tuple必须关系属性以及关系属性的内容完全相同但是Join可以有不相同的关系属性（相同的关系属性其内容必须相同）。