Bạn là một backend developer hàng ngày phải làm việc với những cơ sở dữ liệu (database) đồ sộ, cồng kềnh? Bạn đã quá mệt mỏi với việc phải viết những câu lệnh SQL phức tạp, dài dòng mỗi lần muốn thao tác với database? Để giải quyết những khó khăn và bất tiện khi làm việc với database, khái niệm ORM đã ra đời. Trong bài viết này, hãy cùng hai Software Engineer Intern – Bill và Phi — khám phá xem ORM là gì và tìm hiểu về cách sử dụng SQLAlchemy, một ORM cho ngôn ngữ Python, để hiểu tại sao chúng lại phổ biến như vậy nhé!
Chú ý: bởi bài viết này chỉ tập trung vào các hệ quản trị cơ sở dữ liệu quan hệ (Relational Database Management System, gọi tắt là RDBMS), ví dụ như MySQL, PostgreSQL, SQLite,… nên trong khuôn khổ bài viết, thuật ngữ ‘database’ sẽ được hiểu là các ‘relational database’.
Ngày xửa ngày xưa, …
Xưa kia, khi loài người còn chưa biết đến khái niệm ORM, mỗi khi các lập trình viên muốn tương tác với relational database (tạo, đọc, sửa, xoá dữ liệu trong bảng), họ sẽ phải viết câu lệnh SQL thuần và execute nó ở trong chương trình sử dụng connector. Tưởng tượng bạn có một bảng Person với hai cột name và age trong database và bạn muốn thêm một dòng dữ liệu (record) vào đó, bạn sẽ phải làm như sau (trong các ví dụ ở bài viết này, chúng mình sẽ sử dụng ngôn ngữ lập trình Python):
Như bạn thấy, bạn sẽ phải viết câu lệnh SQL thuần dưới dạng một string rồi dùng connector để execute nó. Điều này đôi khi gây phiền toái, bởi những câu lệnh SQL thuần thường dài dòng, khó thay đổi, và đôi khi không tối ưu. Ngoài ra, việc cập nhật, thay đổi cơ sở dữ liệu không hề dễ dàng. Ví như mỗi lần thay đổi cấu trúc bảng, nếu không có ORM, chúng ta sẽ phải truy cập vào database server và thay đổi bằng câu lệnh SQL, dẫn tới quy trình làm việc khó khăn do phải làm việc ở hai môi trường — application code và database server. Trong khi đó, nếu sử dụng ORM, chúng ta có thể thay đổi bảng rồi thực hiện migrate ở ngay trong application code, tránh phải làm việc trong database server (điều này chúng ta sẽ tìm hiểu kĩ hơn ở phần 2 của bài viết với những ví dụ cụ thể sử dụng SQLAlchemy, một ORM hết sức phổ biến hiện nay).
Từ đó, ORM xuất hiện như một hướng tiếp cận khác để giải quyết vấn đề quản trị cơ sở dữ liệu một cách hiệu quả hơn.
ORM là viết tắt của cụm từ Object Relational Mapping. Hiểu một cách đơn giản, ORM là một kỹ thuật trong lập trình giúp biểu diễn các dòng dữ liệu (record) trong cơ sở dữ liệu bằng các đối tượng, vật thể (object) tương ứng trong ngôn ngữ lập trình. Nhờ đó, ta có thể tương tác, xử lí những data record tương tự như những object. ORM như một ‘cây đũa thần’ có thể hoá phép các record trong database thành những object, giúp cho sự tương tác của người dùng với data record đơn giản như với các object của ngôn ngữ lập trình.
Ví dụ như trong hình trên, dòng dữ liệu với ID bằng 1 được biểu diễn dưới dạng một Person object với 3 thuộc tính (properties) sau: first_name là John, last_name là Connor và phone_number là +16105551234.
Có hai mô hình thiết kế (design pattern) ORM được biết đến và sử dụng rộng rãi: Active Record và Data Mapper.
- Active Record
Active Record là mô hình thiết kế ORM mà trong đó mỗi bảng trong cơ sở dữ liệu (table in database) được gói gọn trong một model. Do vậy, mỗi object thuộc model sẽ được gắn với một dòng (record) trong bảng. Với Active Record, ở trong model, người dùng sẽ không cần phải ghi rõ những properties của model đó hay sự liên hệ của những properties ấy đến database, mà object sẽ tự động biết được chúng bằng cách nhìn vào database schema. Ngoài ra, các ORM sử dụng Active Record thường có sẵn những CRUD (Create — Read — Update — Delete) method như save(), create(),… thuận tiện cho việc tạo object.
Những ORM nổi tiếng sử dụng Active Record bao gồm Eloquent, Ruby on Rails, Django’s ORM hay Yii.
Trở lại với ví dụ về bảng Person bao gồm 3 cột first_name, last_name và phone_number như trên, khi bạn sử dụng Django’s ORM, một ORM với mô hình Active Record, việc khai báo một model sẽ diễn ra như sau:
Với mô hình Active Record, model nhất định phải tuân theo cấu trúc bảng, ví dụ như model Person ở đây sẽ phải có 3 cột first_name, last_name và phone_number như ở trong bảng Person.
- Data Mapper
Khác với mô hình Active Record, ở trong các ORM sử dụng mô hình thiết kế Data Mapper, thay vì kết nối trực tiếp mỗi object với một record trong database, ORM sẽ đóng vai trò như một lớp (layer) có chức năng tách biệt cũng như vận chuyển dữ liệu hai chiều (bidirectional transfers of data) giữa cơ sở dữ liệu và ứng dụng (application). Điều này nghĩa là các objects ở application sẽ không có thông tin gì về database hay những thuộc tính của các models. Các object được tạo ra sẽ không biết đến sự tồn tại của database và ngược lại.
Những ORM nổi tiếng sử dụng Mapper có thể kể đến Doctrine, Hibernate và SQLAlchemy.
Sự khác biệt lớn nhất giữa hai mô hình thiết kế trên chính là trong khi mô hình Active Record hướng tới mục đích xoá đi khoảng cách giữa application và database thì mô hình Data Mapper có vai trò giúp người sử dụng phân tách rõ ràng hơn hai bộ phận trên.
Với ví dụ về bảng Person kể trên, việc khai báo model với SQLAlchemy, một Data Mapper ORM, sẽ được thực hiện như sau:
Như các bạn thấy, với các Data Mapper ORMs, model có thể thừa hoặc thiếu một số column so với cấu trúc bảng, ở đây là thiếu đi cột phone_number và có thêm cột address.
Ưu điểm:
- Ngắn gọn. ORM cho phép người dùng sử dụng ngôn ngữ lập trình mà họ muốn với cú pháp ngắn gọn và đơn giản hơn so với việc sử dụng câu lệnh SQL, qua đó giảm thiểu lượng code phải viết.
- Tối ưu. ORM cũng cho phép người dùng tận dụng sự tối ưu của phương pháp lập trình hướng đối tượng (Object — Oriented Programming) như kế thừa dữ liệu, đóng gói, khái quát hoá thông qua việc biểu diễn các record trong database dưới dạng các object.
- Linh hoạt. Có thể chuyển đổi linh hoạt giữa các hệ quản trị cơ sở dữ liệu khác nhau (MySQL, Sqlite3, PostgreSQL,…) cũng như không cần phải biết quá nhiều về các hệ thống này cũng như ngôn ngữ SQL.
Nhược điểm:
- Thời gian. Bởi ORM là framework, người dùng sẽ phải mất thời gian học và làm quen với cách sử dụng các framework này.
- Sự chủ động. Khi sử dụng ORM, người dùng sẽ có ít sự chủ động và kiểm soát hơn đối với database.
Ở phần hai của bài viết, hãy cùng tìm hiểu cách sử dụng SQLAlchemy, một ORM rất phổ biến trong ngôn ngữ Python, để xem tại sao ORM có thể tiết kiệm cho bạn nhiều thời gian và công sức nhé!
SQLAlchemy là một bộ công cụ SQL mã nguồn mở và ORM sử dụng trong ngôn ngữ lập trình Python, giúp hỗ trợ việc quản lý và thao tác với cơ sở dữ liệu. SQLAlchemy cung cấp cho người dùng một ORM sử dụng mô hình thiết kế Data Mapper.
Được ra lò vào năm 2006, SQLAlchemy nhanh chóng khẳng định vị thế của mình trong cộng đồng lập trình viên Python, được sử dụng rất rộng rãi bên cạnh Django’s ORM. SQLAlchemy được sử dụng phổ biến ở cả những “ông lớn” trong ngành công nghệ như Yelp!, Reddit, Dropbox, …
- Kết nối với database
Bạn có thể thay parameter tuỳ thuộc vào địa chỉ database của bạn, trong trường hợp này chúng ta sử dụng in-memory sqlite.
- Khai báo mapping và tạo schema
ORM truyền thống gồm hai bước: mô tả database chúng ta phải xử lý và khai báo class mà sẽ được đối chiếu với các bảng. SQLAlchemy gộp hai bước này vào một, sử dụng Declarative Base.
- Query
Trước khi thực hiện các tác vụ như query hay thay đổi database, chúng ta cần kết nối với database trong một session:
Giả sử chúng ta muốn tìm tất cả các Employee có tên là Alice, chúng ta có thấy lấy kết quả rất đơn giản bằng:
Nếu chúng ta có quá nhiều người tên là Alice, và muốn giới hạn số lượng lấy ra và xếp theo id:
- Thêm và update
Chúng ta có thể dễ dàng thêm và update một (hoặc nhiều) hàng trong database bằng qua thao tác với các instance của class Employee:
Giả sử chúng ta muốn thay đổi tuổi của Bob:
Và đừng quên commit sau khi hoàn thành xong thao tác bằng:
- Rollback
SQLAlchemy cho phép chúng ta có thể rollback mỗi khi mắc sai lầm.
Giả sử chúng ta thêm nhầm một Employee:
Chúng ta có thể rollback transaction vừa rồi với câu lệnh, bạn có thể đoán được đấy:
Bên cạnh thừa hưởng các tính năng của một ORM như liệt kê bên trên, SQLAlchemy còn cung cấp cho người dùng rất nhiều chức năng nổi trội khác.
Bạn đã bao giờ nhận ra mình cần thay đổi schema trong quá trình build chưa? Nếu như sử dụng câu lệnh thuần SQL thông thường, bạn phải tự mình cập nhật trong database server ít nhất một bảng. SQLAlchemy giúp bạn đồng bộ hoá model và schema trong khi bạn chỉ làm việc ở môi trường code. Bằng cách sử dụng add-on alembic của SQLAlchemy, bạn có thể thay đổi schema trong code rồi chạy câu lệnh sau trong terminal:
Và kaboom, schema và model của bạn đã được đồng bộ. Quá đơn giản phải không nào?
Với bất kì một sản phẩm nào, kiểm thử (test) là giai đoạn hết sức quan trọng. Trong việc test ứng dụng có sử dụng database, người dùng cần đảm bảo mở kết nối trước khi thao tác với database, và ngắt kết nối sau khi thao tác, những điều này phải thật đảm bảo. Điều này không chỉ gây ra lặp code, mà còn gây ra nhiều rủi ro, ví như bạn quên đóng kết nối sau khi thao tác.
SQLAlchemy Core có hàm connect, dùng song song với engine giúp bạn duy trì kết nối với database. Sử dụng connection hợp lý trong việc test đảm bảo rằng trong chỉ có một kết nối trong suốt quá trình test.
Một điều tuyệt vời khi làm việc với SQLAlchemy là cách tổ chức mối quan hệ giữa các bảng. Nó giúp người dùng xác định rõ ràng mối quan hệ trong code, được phản ánh cụ thể hơn qua lập trình hướng đối tượng. Các đối tượng này còn có thể liên kết, hay được bọc trong nhau.
Lazy Loading còn giúp người dùng xác định được cách mình muốn lấy đối tượng từ database. Người dùng có thể chọn thông tin từ một bảng (lazy= ‘select’), thông tin liên kết với bảng khác (lazy = ‘joined’), hoặc lấy object để có thể tiếp tục truy sau này (lazy = ‘dynamic’).
Trước khi quyết định có nên sử dụng một thư viện cho ứng dụng của mình, một số câu hỏi được đặt ra là: “Nó có dễ học không?”, “Cộng đồng người dùng có lớn không?”, “tài liệu có chi tiết không?”. Và câu trả lời cho tất cả các câu hỏi trên là có.
Tài liệu của SQLAlchemy rất chi tiết và xuyên suốt. Ngay cả khi bạn là người mới viết Python, bộ tài liệu còn có ví dụ từ giúp bạn đi từng bước một để làm quen với thư viện cho đến sử dụng những tính năng cao cấp nhất của thư viện.
Trên cộng đồng StackOverflow, có hẳn hơn 16000 câu hỏi có tag SQLAlchemy. Vì thế, bạn cũng không sợ mình sẽ gặp vấn đề chưa được giải quyết khi mới nhúng tay vào thư viện này. Còn chần chờ gì mà không đi một vòng qua tutorials của thư viện nhỉ?
SQLAlchemy được sử dụng rất rộng rãi ở team backend của Got It. Chẳng những thế mà trước khi một thực tập viên được phép làm việc trên mã nguồn của công ty, bạn ấy phải học một khóa học về SQLAlchemy để có thể sử dụng nhuần nhuyễn thư viện này trong công việc.
Qua bài viết này, hi vọng các bạn đã biết thêm những điều mới về ORM cũng như SQLAlchemy, qua đó có thể áp dụng vào công việc của mình!