ORM và SQLAlchemy — ‘chiếc đũa thần’ trong quản trị cơ sở dữ liệu

Bạn là một backend developer hàng ngày phải làm việc với những cơ sở dữ liệu (database) đồ sộ, cồng kềnh? Bạn đã quá mệt mỏi với việc phải viết những câu lệnh SQL phức tạp, dài dòng mỗi lần muốn thao tác với database? Để giải quyết những khó khăn và bất tiện khi làm việc với database, khái niệm ORM đã ra đời. Trong bài viết này, hãy cùng hai Software Engineer InternBill và Phi — khám phá xem ORM là gì và tìm hiểu về cách sử dụng SQLAlchemy, một ORM cho ngôn ngữ Python, để hiểu tại sao chúng lại phổ biến như vậy nhé!

Chú ý: bởi bài viết này chỉ tập trung vào các hệ quản trị cơ sở dữ liệu quan hệ (Relational Database Management System, gọi tắt là RDBMS), ví dụ như MySQL, PostgreSQL, SQLite,… nên trong khuôn khổ bài viết, thuật ngữ ‘database’ sẽ được hiểu là các ‘relational database’.

Ngày xửa ngày xưa, …

Xưa kia, khi loài người còn chưa biết đến khái niệm ORM, mỗi khi các lập trình viên muốn tương tác với relational database (tạo, đọc, sửa, xoá dữ liệu trong bảng), họ sẽ phải viết câu lệnh SQL thuần và execute nó ở trong chương trình sử dụng connector. Tưởng tượng bạn có một bảng Person với hai cột name và age trong database và bạn muốn thêm một dòng dữ liệu (record) vào đó, bạn sẽ phải làm như sau (trong các ví dụ ở bài viết này, chúng mình sẽ sử dụng ngôn ngữ lập trình Python):

Image for post

Như bạn thấy, bạn sẽ phải viết câu lệnh SQL thuần dưới dạng một string rồi dùng connector để execute nó. Điều này đôi khi gây phiền toái, bởi những câu lệnh SQL thuần thường dài dòng, khó thay đổi, và đôi khi không tối ưu. Ngoài ra, việc cập nhật, thay đổi cơ sở dữ liệu không hề dễ dàng. Ví như mỗi lần thay đổi cấu trúc bảng, nếu không có ORM, chúng ta sẽ phải truy cập vào database server và thay đổi bằng câu lệnh SQL, dẫn tới quy trình làm việc khó khăn do phải làm việc ở hai môi trường — application code và database server. Trong khi đó, nếu sử dụng ORM, chúng ta có thể thay đổi bảng rồi thực hiện migrate ở ngay trong application code, tránh phải làm việc trong database server (điều này chúng ta sẽ tìm hiểu kĩ hơn ở phần 2 của bài viết với những ví dụ cụ thể sử dụng SQLAlchemy, một ORM hết sức phổ biến hiện nay).

Từ đó, ORM xuất hiện như một hướng tiếp cận khác để giải quyết vấn đề quản trị cơ sở dữ liệu một cách hiệu quả hơn.

1. ORM
ORM là gì

ORM là viết tắt của cụm từ Object Relational Mapping. Hiểu một cách đơn giản, ORM là một kỹ thuật trong lập trình giúp biểu diễn các dòng dữ liệu (record) trong cơ sở dữ liệu bằng các đối tượng, vật thể (object) tương ứng trong ngôn ngữ lập trình. Nhờ đó, ta có thể tương tác, xử lí những data record tương tự như những object. ORM như một ‘cây đũa thần’ có thể hoá phép các record trong database thành những object, giúp cho sự tương tác của người dùng với data record đơn giản như với các object của ngôn ngữ lập trình.

Ví dụ như trong hình trên, dòng dữ liệu với ID bằng 1 được biểu diễn dưới dạng một Person object với 3 thuộc tính (properties) sau: first_name là John, last_name là Connor và phone_number là +16105551234.

Có những kiểu ORM nào

Có hai mô hình thiết kế (design pattern) ORM được biết đến và sử dụng rộng rãi: Active Record và Data Mapper.

  • Active Record

Active Record là mô hình thiết kế ORM mà trong đó mỗi bảng trong cơ sở dữ liệu (table in database) được gói gọn trong một model. Do vậy, mỗi object thuộc model sẽ được gắn với một dòng (record) trong bảng. Với Active Record, ở trong model, người dùng sẽ không cần phải ghi rõ những properties của model đó hay sự liên hệ của những properties ấy đến database, mà object sẽ tự động biết được chúng bằng cách nhìn vào database schema. Ngoài ra, các ORM sử dụng Active Record thường có sẵn những CRUD (Create — Read — Update — Delete) method như save()create(),… thuận tiện cho việc tạo object.

Những ORM nổi tiếng sử dụng Active Record bao gồm Eloquent, Ruby on Rails, Django’s ORM hay Yii.

Trở lại với ví dụ về bảng Person bao gồm 3 cột first_name, last_name và phone_number như trên, khi bạn sử dụng Django’s ORM, một ORM với mô hình Active Record, việc khai báo một model sẽ diễn ra như sau:

Việc khai báo một model ORM

Với mô hình Active Record, model nhất định phải tuân theo cấu trúc bảng, ví dụ như model Person ở đây sẽ phải có 3 cột first_name, last_name và phone_number như ở trong bảng Person.

  • Data Mapper

Khác với mô hình Active Record, ở trong các ORM sử dụng mô hình thiết kế Data Mapper, thay vì kết nối trực tiếp mỗi object với một record trong database, ORM sẽ đóng vai trò như một lớp (layer) có chức năng tách biệt cũng như vận chuyển dữ liệu hai chiều (bidirectional transfers of data) giữa cơ sở dữ liệu và ứng dụng (application). Điều này nghĩa là các objects ở application sẽ không có thông tin gì về database hay những thuộc tính của các models. Các object được tạo ra sẽ không biết đến sự tồn tại của database và ngược lại.

Những ORM nổi tiếng sử dụng Mapper có thể kể đến Doctrine, Hibernate và SQLAlchemy.

Sự khác biệt lớn nhất giữa hai mô hình thiết kế trên chính là trong khi mô hình Active Record hướng tới mục đích xoá đi khoảng cách giữa application và database thì mô hình Data Mapper có vai trò giúp người sử dụng phân tách rõ ràng hơn hai bộ phận trên.

Với ví dụ về bảng Person kể trên, việc khai báo model với SQLAlchemy, một Data Mapper ORM, sẽ được thực hiện như sau:

Data Mapper ORM

Như các bạn thấy, với các Data Mapper ORMs, model có thể thừa hoặc thiếu một số column so với cấu trúc bảng, ở đây là thiếu đi cột phone_number và có thêm cột address.

ORM có ưu, nhược điểm gì

Ưu điểm:

  • Ngắn gọn. ORM cho phép người dùng sử dụng ngôn ngữ lập trình mà họ muốn với cú pháp ngắn gọn và đơn giản hơn so với việc sử dụng câu lệnh SQL, qua đó giảm thiểu lượng code phải viết.
  • Tối ưu. ORM cũng cho phép người dùng tận dụng sự tối ưu của phương pháp lập trình hướng đối tượng (Object — Oriented Programming) như kế thừa dữ liệu, đóng gói, khái quát hoá thông qua việc biểu diễn các record trong database dưới dạng các object.
  • Linh hoạt. Có thể chuyển đổi linh hoạt giữa các hệ quản trị cơ sở dữ liệu khác nhau (MySQL, Sqlite3, PostgreSQL,…) cũng như không cần phải biết quá nhiều về các hệ thống này cũng như ngôn ngữ SQL.

Nhược điểm:

  • Thời gian. Bởi ORM là framework, người dùng sẽ phải mất thời gian học và làm quen với cách sử dụng các framework này.
  • Sự chủ động. Khi sử dụng ORM, người dùng sẽ có ít sự chủ động và kiểm soát hơn đối với database.

Ở phần hai của bài viết, hãy cùng tìm hiểu cách sử dụng SQLAlchemy, một ORM rất phổ biến trong ngôn ngữ Python, để xem tại sao ORM có thể tiết kiệm cho bạn nhiều thời gian và công sức nhé!

SQLAlchemy
SQLAlchemy là gì

SQLAlchemy là một bộ công cụ SQL mã nguồn mở và ORM sử dụng trong ngôn ngữ lập trình Python, giúp hỗ trợ việc quản lý và thao tác với cơ sở dữ liệu. SQLAlchemy cung cấp cho người dùng một ORM sử dụng mô hình thiết kế Data Mapper.

Được ra lò vào năm 2006, SQLAlchemy nhanh chóng khẳng định vị thế của mình trong cộng đồng lập trình viên Python, được sử dụng rất rộng rãi bên cạnh Django’s ORM. SQLAlchemy được sử dụng phổ biến ở cả những “ông lớn” trong ngành công nghệ như Yelp!, Reddit, Dropbox, …

Ví dụ về SQLAlchemy
  • Kết nối với database
VD SQLAlchemy 1

Bạn có thể thay parameter tuỳ thuộc vào địa chỉ database của bạn, trong trường hợp này chúng ta sử dụng in-memory sqlite.

  • Khai báo mapping và tạo schema

ORM truyền thống gồm hai bước: mô tả database chúng ta phải xử lý và khai báo class mà sẽ được đối chiếu với các bảng. SQLAlchemy gộp hai bước này vào một, sử dụng Declarative Base.

VD SQLAlchemy 2
  • Query

Trước khi thực hiện các tác vụ như query hay thay đổi database, chúng ta cần kết nối với database trong một session:

VD SQLAlchemy 3

Giả sử chúng ta muốn tìm tất cả các Employee có tên là Alice, chúng ta có thấy lấy kết quả rất đơn giản bằng:

VD SQLAlchemy 4

Nếu chúng ta có quá nhiều người tên là Alice, và muốn giới hạn số lượng lấy ra và xếp theo id:

VD SQLAlchemy 5
  • Thêm và update

Chúng ta có thể dễ dàng thêm và update một (hoặc nhiều) hàng trong database bằng qua thao tác với các instance của class Employee:

VD SQLAlchemy 6

Giả sử chúng ta muốn thay đổi tuổi của Bob:

VD SQLAlchemy 7

Và đừng quên commit sau khi hoàn thành xong thao tác bằng:

VD SQLAlchemy 21
  • Rollback

SQLAlchemy cho phép chúng ta có thể rollback mỗi khi mắc sai lầm.

Giả sử chúng ta thêm nhầm một Employee:

VD SQLAlchemy 8

Chúng ta có thể rollback transaction vừa rồi với câu lệnh, bạn có thể đoán được đấy:

VD SQLAlchemy 9
Lợi ích sử dụng SQLAlchemy

Bên cạnh thừa hưởng các tính năng của một ORM như liệt kê bên trên, SQLAlchemy còn cung cấp cho người dùng rất nhiều chức năng nổi trội khác.

Thay đổi schema

Bạn đã bao giờ nhận ra mình cần thay đổi schema trong quá trình build chưa? Nếu như sử dụng câu lệnh thuần SQL thông thường, bạn phải tự mình cập nhật trong database server ít nhất một bảng. SQLAlchemy giúp bạn đồng bộ hoá model và schema trong khi bạn chỉ làm việc ở môi trường code. Bằng cách sử dụng add-on alembic của SQLAlchemy, bạn có thể thay đổi schema trong code rồi chạy câu lệnh sau trong terminal:

Thay đổi schema

Và kaboom, schema và model của bạn đã được đồng bộ. Quá đơn giản phải không nào?

Công cụ hữu ích trong test

Với bất kì một sản phẩm nào, kiểm thử (test) là giai đoạn hết sức quan trọng. Trong việc test ứng dụng có sử dụng database, người dùng cần đảm bảo mở kết nối trước khi thao tác với database, và ngắt kết nối sau khi thao tác, những điều này phải thật đảm bảo. Điều này không chỉ gây ra lặp code, mà còn gây ra nhiều rủi ro, ví như bạn quên đóng kết nối sau khi thao tác.

SQLAlchemy Core có hàm connect, dùng song song với engine giúp bạn duy trì kết nối với database. Sử dụng connection hợp lý trong việc test đảm bảo rằng trong chỉ có một kết nối trong suốt quá trình test.

Cách tổ chức mối quan hệ giữa các bảng

Một điều tuyệt vời khi làm việc với SQLAlchemy là cách tổ chức mối quan hệ giữa các bảng. Nó giúp người dùng xác định rõ ràng mối quan hệ trong code, được phản ánh cụ thể hơn qua lập trình hướng đối tượng. Các đối tượng này còn có thể liên kết, hay được bọc trong nhau.

Lazy Loading còn giúp người dùng xác định được cách mình muốn lấy đối tượng từ database. Người dùng có thể chọn thông tin từ một bảng (lazy= ‘select’), thông tin liên kết với bảng khác (lazy = ‘joined’), hoặc lấy object để có thể tiếp tục truy sau này (lazy = ‘dynamic’).

Tài liệu chi tiết, cụ thể và dễ theo

Trước khi quyết định có nên sử dụng một thư viện cho ứng dụng của mình, một số câu hỏi được đặt ra là: “Nó có dễ học không?”, “Cộng đồng người dùng có lớn không?”, “tài liệu có chi tiết không?”. Và câu trả lời cho tất cả các câu hỏi trên là có.

Tài liệu của SQLAlchemy rất chi tiết và xuyên suốt. Ngay cả khi bạn là người mới viết Python, bộ tài liệu còn có ví dụ từ giúp bạn đi từng bước một để làm quen với thư viện cho đến sử dụng những tính năng cao cấp nhất của thư viện.

Trên cộng đồng StackOverflow, có hẳn hơn 16000 câu hỏi có tag SQLAlchemy. Vì thế, bạn cũng không sợ mình sẽ gặp vấn đề chưa được giải quyết khi mới nhúng tay vào thư viện này. Còn chần chờ gì mà không đi một vòng qua tutorials của thư viện nhỉ?

SQLAlchemy ở Got It

SQLAlchemy được sử dụng rất rộng rãi ở team backend của Got It. Chẳng những thế mà trước khi một thực tập viên được phép làm việc trên mã nguồn của công ty, bạn ấy phải học một khóa học về SQLAlchemy để có thể sử dụng nhuần nhuyễn thư viện này trong công việc.

Qua bài viết này, hi vọng các bạn đã biết thêm những điều mới về ORM cũng như SQLAlchemy, qua đó có thể áp dụng vào công việc của mình!

Đọc thêm về quy trình tuyển dụng tại đây.

https://d1iv5z3ivlqga1.cloudfront.net/wp-content/uploads/2021/04/29235048/1_QAG9RXQyyMAY7i9OYo84FA.png
Got It Vietnam
July 29, 2020
Share this post to:
Tags:
0 Comments
Inline Feedbacks
View all comments
Các bài viết liên quan
Chức năng của hệ quản trị cơ sở dữ liệu là gì?

Chức năng của hệ quản trị cơ sở dữ liệu là gì?

Bạn có biết chức năng của hệ quản trị cơ sở dữ liệu là gì? Hệ quản trị cơ sở dữ liệu không còn quá xa lạ với những bạn lập trình hay IT. Tuy nhiên bạn đã hiểu về nó chưa? Bài viết dưới đây sẽ mang đến cho bạn câu trả lời cụ […]
MySQL Function là gì? Tổng quan về MySQL Function

MySQL Function là gì? Tổng quan về MySQL Function

MySQL là hệ thống quản trị cơ sở dữ liệu phổ biến. Rất nhiều công ty đã và đang sử dụng MySQL. Một khái niệm chúng ta cần quan tâm là MySQL Function. MySQL Function có nghĩa là hàm trong MySQL.  Nhưng, trước hết, chúng ta cần tìm hiểu kỹ hơn về MySQL.  Mục lục1. […]
Các cơ sở để phân biệt MySQL và SQL Server

Các cơ sở để phân biệt MySQL và SQL Server

MySQL và SQL Server có cùng chức năng, gốc SQL gần như tương tự nhau. Vậy phân biệt MySQL và SQL Server thế nào? Got It sẽ đưa ra những thông tin giúp bạn có thể dễ dàng nhận ra điểm khác nhau giữa hai hệ quản trị cơ sở dữ liệu này.  Mục lục1. […]
DBMS là gì? Ví dụ về hệ quản trị cơ sở dữ liệu

DBMS là gì? Ví dụ về hệ quản trị cơ sở dữ liệu

Hệ quản trị cơ sở dữ liệu là gì? Nó đóng vai trò và tác động như thế nào đến quy trình quản lý dữ liệu? Bài viết này của Got It sẽ giải đáp những thắc mắc trên. Đồng thời, chúng tôi sẽ đưa ra các ví dụ về hệ quản trị cơ sở […]
Phân biệt cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu

Phân biệt cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu

Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu luôn cần thiết với bất kỳ tổ chức hay đơn vị nào. Cùng phân biệt cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu để hiểu thêm về hai khái niệm quan trọng này ngay trong bài viết sau đây […]
Hệ quản trị cơ sở dữ liệu SQL Server là gì?

Hệ quản trị cơ sở dữ liệu SQL Server là gì?

SQL Server được lựa chọn sử dụng nhiều trong các lĩnh vực bởi chức năng quản lý dữ liệu. Vậy hệ quản trị cơ sở dữ liệu SQL Server là gì? Tại sao SQL Server lại được ưa chuộng trong thiết kế web. Hãy tìm hiểu những thông tin tổng quan về SQL Server qua […]