DB 92

[RDBMS] 페이징 (Pagination)

1. SQL Standard의 페이징SQL 2008 표준에서는 대용량 데이터의 일부만 선별적으로 조회할 수 있도록 페이징을 위한 구문을 도입FETCH FIRST N ROWS ONLY: 정렬된 결과 집합에서 상위 N개 행만 조회OFFSET M ROWS FETCH NEXT N ROWS ONLY: 결과 집합에서 M개 행을 건너뛴 뒤, 그다음 N개 행 조회 부연 설명해당 쿼리는 post 테이블에서 created_on과 id를 내림차순으로 정렬한 뒤, 상위 5개의 title만 선택하여 조회정렬 기준이 없다면, 반환되는 데이터의 순서는 DB 내부 처리 로직에 따라 비결정적이기 때문에, 정확한 페이징 결과를 얻을 수 없으므로 항상 원하는 순서대로 결과를 얻으려면 ORDER BY를 반드시 사용해야 함 부연 설명..

DB 2025.05.12

[RDBMS] 파생 테이블과 공통 테이블 표현식

개요관계형 데이터베이스에서 복잡한 쿼리를 작성할 때, 임시적으로 쿼리 결과를 재사용하거나 여러 단계로 나누어 데이터를 처리하는 방법은 다음과 같음 파생 테이블(Derived Table)공통 테이블 표현식(CTE, Common Table Expression 1. 파생 테이블 (Derived Table)파생 테이블이란, FROM절에 직접 쿼리(SELECT문)를 작성하여 만들어지는 임시 테이블을 의미해당 테이블은 쿼리 실행 시점에만 존재하며, 별칭을 반드시 부여해야 함파생 테이블의 특징은 다음과 같음 쿼리 내부에서만 사용되는 일회성 임시 테이블FROM절에서만 정의할 수 있고, 쿼리의 나머지 부분에서만 접근 가능복잡한 쿼리를 쪼개서 읽기 쉽게 만들거나, 집계 결과를 다시 활용할 때 주로 사용중첩 사용(파생 테이..

DB 2025.05.12

[RDBMS] JOIN 성능

1. JOIN vs 서브 쿼리JOIN은 두 개 이상의 테이블을 논리적으로 연결해서, 관련된 데이터를 한 번에 조회할 수 있도록 해주는 SQL의 대표적인 기능i.g. 회원 테이블과 주문 테이블이 따로 있을 때, 회원의 이름과 해당 회원이 주문한 상품 목록을 함께 보고 싶다면 JOIN을 사용JOIN은 여러 테이블의 레코드를 조합하여 복합적인 데이터(복합 프로젝션)를 만드는 데 매우 효율적여러 테이블의 데이터를 결합해야 할 때, 복합적인 결과 셋이 필요할 때, 그리고 결과에서 여러 테이블의 컬럼이 동시에 필요할 때 권장JOIN은 복합적인 데이터 결합에 효율적이지만, 불필요하게 사용할 경우 성능 저하나 복잡도 증가로 이어질 수 있음 서브 쿼리는 쿼리 안에 또 다른 쿼리가 들어 있는 구조서브 쿼리는 주로 데이..

DB 2025.05.12

LATERAL JOIN 개요

LATERAL JOIN이란?SQL 하위 쿼리가 메인 쿼리의 각 행에 접근할 수 있도록 해주는 조인 방식표준 SQL 및 PostgreSQL, MySQL 8.0 이상, Oracle 등에서 지원되는 기능LATERAL 키워드를 사용하면 서브 쿼리 안에서 외부 쿼리의 칼럼을 자유롭게 참조 가능전통적인 JOIN에서는 서브쿼리 내에서 외부 쿼리의 컬럼을 직접 참조할 수 없지만, LATERAL JOIN은 이를 가능케 하여 더욱 유연한 데이터 변환 및 분석이 가능해짐 LATERAL JOIN PostgreSQL 예시 #1각 부서별로 직원들의 정보와, 그 직원이 속한 부서에서 최근 등록된 공지사항 2개를 최신순으로 함께 보여주고 싶다고 가정이런 요구사항은 전통적인 JOIN이나 서브쿼리만으로는 복잡하거나 효율이 떨어질 수 있..

DB 2025.04.30

[13장] 복제 셋 관리

1. 독립 실행형 모드에서 멤버 시작많은 유지 보수 작업은 쓰기와 관련되어 있어 Secondary에서 수행될 수 없으며, 애플리케이션 성능에 영향을 미치기 때문에 Primary에서 수행하면 안 됨따라서 해당 절에서는 독립 실행형 모드 서버 시작을 자주 언급함이는 멤버가 복제 셋의 멤버가 아닌 독립 실행형 서버로 재시작함을 의미 독립 실행형 모드에서 멤버를 시작하려면 먼저 명령행 인수를 확인해야 하며 인수는 다음과 같다고 가정해당 서버에서 유지보수를 수행하려면 replSet 옵션 없이 서버를 재시작하면 되며 이는 일반적인 독립 실행형 mongod처럼 읽기와 쓰기가 가능하게 해 줌복제 셋에 있는 다른 서버에서 해당 서버와 통신하기를 원치 않으므로 다른 멤버들이 서버를 발견하지 못하도록 서버가 다른 포트로 수..

[12장] 애플리케이션에서 복제 셋 연결

1. 클라이언트-복제 셋 연결 동작몽고DB 드라이버는 서버가 독립 실행형 몽고DB 인스턴스든 복제 셋이든 관계없이 몽고DB 서버와의 통신을 관리하도록 설계됨복제 셋이면 기본적으로 드라이버는 Primary에 연결되고 모든 트래픽을 Primary에 라우팅함애플리케이션은 복제 셋이 조용히 백그라운드에서 대기 상태를 유지하는 동안 마치 독립 실행형 서버와 통신하듯이 읽기와 쓰기를 수행할 수 있음 복제 셋에 대한 연결은 단일 서버에 대한 연결과 비슷함드라이버에 MongoClient를 사용하고, 연결할 드라이버를 위한 시드 목록 (서버 목록)을 제공하면 됨드라이버는 시드에 연결되면 다른 멤버들을 발견하므로 시드 목록에 모든 멤버를 나열할 필요는 없음 "mongodb://server-1:27017, server-2:..

[11장] 복제 셋 구성 요소

1. 동기화몽고DB는 Primary가 수행한 쓰기를 모두 포함하는 로그, 즉 oplog를 보관함으로써 복제를 수행oplog는 Primary의 로컬 데이터베이스에 있는 제한 컬렉션이며, Secondary는 해당 컬렉션에 복제를 위한 연산을 쿼리 각 Secondary는 Primary로부터 복제한 작업을 각각 기록하는 oplog를 보관Secondary는 동기화하는 멤버로부터 연산을 가져와서 데이터셋에 적용한 뒤 자신의 oplog에 씀만약 연산 적용에 실패하면 Secondary는 종료됨Secondary가 어떤 이유로든 다운되면, 재시작할 때 oplog에 있는 마지막 연산과 동기화 수행연산이 데이터에 적용되고 oplog에 쓰이면, Secondary는 이미 데이터에 적용된 연산을 재생할 수 있음, 즉 oplog 연..

[10장] 복제 셋 설정

1. 복제 소개1장부터 지금까지 시작하기 쉽도록 독립 실행형 서버인 단일 mongod 서버를 사용해 왔지만 실제 서비스를 운영하는 데 사용하면 매우 위험한 방식만약 서버가 고장이 나거나 이용 불가능한 상태가 될 경우 적어도 잠시 동안은 DB를 사용할 수 없을 것최악의 경우에는 디스크나 네트워크 문제가 데이터 손상이나 접근 불가 문제를 야기할 것 복제는 데이터의 동일한 복사본을 여러 서버상에서 보관하는 방법이며 실제 서비스를 배포할 때 권장되는 방식한 대 또는 그 이상의 서버에 이상이 발생하더라도, 복제는 애플리케이션이 정상적으로 동작하게 하고 데이터를 안전하게 보존해 줌복제를 사용하는 상태에서 서버가 다운되면, 복제 셋에 있는 다른 서버를 통해 데이터 접근 가능서버상의 데이터가 손상되거나 접근할 수 없는..

[9장] 애플리케이션 설계

1. 스키마 설계 고려 사항데이터 표현의 핵심 요소는 데이터가 도큐먼트에서 표현되는 방식인 스키마의 설계가장 좋은 설계 접근 방식은 애플리케이션에서 원하는 방식으로 데이터를 표현하는 방법이므로 관계형 데이터베이스와 달리, 스키마를 모델링하기 전 먼저 쿼리 및 데이터 접근 패턴에 대한 이해 필요 다음은 스키마를 설계할 때 고려할 주요 요소입니다. 가. 제약 사항도큐먼트의 최대 크기는 16MB이며, 디스크에서 전체 도큐먼트를 읽고 씀갱신은 전체 도큐먼트를 다시 씀원자성 갱신은 도큐먼트 단위로 실행됨 나. 쿼리 및 쓰기의 접근 패턴애플리케이션 및 더 넓은 시스템의 워크로드를 식별하고 정량화해야 함워크로드는 애플리케이션의 읽기와 쓰기를 모두 포함 쿼리가 실행되는 시기와 빈도를 알면 가장 일반적인 쿼리를 식별 가..

[8장] 트랜잭션

1. 트랜잭션 소개트랜잭션은 읽기나 쓰기 작업이 가능한 데이터베이스 작업을 하나 이상 포함하는 데이터베이스의 논리적 단위트랜잭션의 중요한 특징은 작업이 성공하든 실패하든 부분적으로는 완료되지 않는다는 점몽고DB에서 트랜잭션을 사용하려면 버전이 4.2 이상이어야 하며 몽고DB 드라이버를 몽고DB 4.2 이상에 맞게 갱신해야 함 1.1 ACID의 정의트랜잭션이 `진정한` 트랜잭션이 되려면 ACID라는 속성을 충족해야 함ACID는 원자성 (Atomicity), 일관성 (Consistency), 고립성 (Isolation), 그리고 영속성 (Durability)의 약어ACID 트랜잭션은 오류가 발생할 때도 데이터와 데이터베이스의 상태의 유효성을 보장 원자성 (Atomicity)은 트랜잭션 내 모든 작업이 적용되..