부트스트래핑(bootstrapping)
부트스트래핑(bootstrapping)은 데이터 샘플링 방법의 하나로, 간단히 얘기하면 중복을 허용하는 리샘플링(resampling)이라고 할 수 있다. 근데 중복을 허용하는 리샘플링 방법을 왜 하필 부트스트랩, 그러니까 부츠에 달린 끈이라고 불렀는지가 예전부터 의문이었다. 단어의 네이밍부터 이해가 가지 않으니, 용어가 잘 기억될리 없었다.
검색 결과, 설명이 분명하게 되어 있는 포스트를 하나 찾을 수 있었다. 관련된 문구를 인용하면 아래와 같다.
The name “bootstrapping” comes from the phrase, “To lift himself up by his bootstraps.” This refers to something that is preposterous and impossible. Try as hard as you can, you cannot lift yourself into the air by tugging at pieces of leather on your boots.
There is some mathematical theory that justifies bootstrapping techniques. However, the use of bootstrapping does feel like you are doing the impossible. Although it does not seem like you would be able to improve upon the estimate of a population statistic by reusing the same sample over and over again, bootstrapping can, in fact, do this.
그러니까, 중복을 허용하는 리샘플링이 “내 부츠끈을 위로 잡아당겨서 나를 들어올리기”처럼 말도 안되고 불가능한 일로 느껴졌던 모양이다. 그런데도 여러 수학적 테크닉을 통해서 가능한 일이 되었고, 현재는 널리 사용되는 샘플링 방법이 된 것 같다.