PyTorch Distributed(2) DP

1 분 소요

Introduction

DP는 one process & multi-gpu로 실행할 수 있는 데이터 병렬 처리를 모듈 수준에서 구현하는 패러다임을 말한다.
이 패러다임에 해당하는 모듈인 torch.nn.DataParallel은 일종의 컨테이너인데, 입력 데이터는 mini-batch로 학습시킬 때 1 batch를 GPU마다 동일하게 분할하여 학습한다.
아래 파이토치 설명에 따르면 입력데이터 이외에 모델 등은 GPU별로 동일하게 복사된다.

This container parallelizes the application of the given module by splitting the input across the specified devices by chunking in the batch dimension (other objects will be copied once per device).

따라서 batch size는 gpu개수보다 크거나 같아야 한다.

DP 모듈을 이용한 학습 과정

아래는 forward 과정이며, backward 비슷한 방식으로 진행된다.

1. Scatter mini-batch inputs to GPUs

mini-batch 데이터를 GPU별로 분할한다. 차원 변환을 통해 0번째 dim은 gpu dim이 된다.
tuple, list 또는 dict type 등은 shallow copy된다.

2. Replicate model on GPUs

moodel이 각 GPU별로 복제된다.

3. Parallel forward passes

력데이터를 모델에 순전파시켜 GPU별 output을 얻는다.

4. Gather outputs on GPU-1

output을 모두 합쳐 1 batch에 대한 output이 최종적으로 얻어진다.

Discussion

실제로는 GIL로 인한 성능 문제로 DDP를 많이 사용하게 되며, 자세한 내용은 아래 Reference들을 참고한다.

Reference

공식문서
참고 블로그 - 사용방법
참고 블로그(Medium)

Twitter Facebook LinkedIn

한국어 텍스트 전처리 활용 (filtering)

5 분 소요

Introduction 이전 포스팅에서 텍스트 전처리 라이브러리 사용법을 익혔다. 이번 포스팅에서는 라이브러리 기능보다는, nlp 모델 성능을 높이기 위해 필요한 텍스트 전처리(필터링) 방법들에 대해 서술한다. 이전 포스팅과 일부 겹치는 내용이 있을 수 있고, 부실하게...

문자열 매칭을 위한 정규식 라이브러리 (re)

8 분 소요

Introduction 크롤링을 하거나, NLP 전처리로 인해 문자열의 특정한 패턴을 찾아야 하는 경우가 있다. 파이썬에서는 find라는 문자열 검색 메소드를 기본으로 지원한다. 문제는 하나의 문자열의 인덱스만을 반환한다. ```python pattern = “node” st...

한국어 텍스트 전처리 라이브러리 사용법