반응형
1. 푸아송 분포의 정의 푸아송 분포, 또는 포아송이라고도 하는 이 특이한 이름의 분포 함수는 주어진 시간 동안 특정 사건이 벌어지는 횟수를 모델링하는 확률 모형입니다. 여기 랜덤한 타이밍에 발생하는 이벤트가 있습니다. 우리는 그 이벤트가 어떤 조건에 맞춰 일어나는지는 모르지만, 주어진 시간동안 평균적으로 $\lambda$ 만큼의 횟수만큼 벌어진다는 사실을 알고 있습니다. 평균은 그렇다치고, 이번에는 특별히 같은 시간동안 동일한 이벤트가 '$x$'번 발생할 확률은 어떻게 될까요? 푸아송 분포는 이를 다음과 같이 수식화합니다. $$P(x\text{;}\ \lambda) = \frac{e^{-\lambda}{\lambda}^x}{x!}\qquad \text{for}\; x = 0,\ 1,\ 2, ... \t..
Python의 scipy.stats 라이브러리는 통계에서 사용하는 확률 분포를 표현할 수 있습니다. 앞선 포스트(https://citizen.tistory.com/41)에서 가장 잘 알려진 6가지의 scipy 확률 분포 클래스를 소개드렸었죠. 베르누이 분포: bernoulli 이항 분포: binom 푸아송 분포: poisson 균일 분포: uniform 정규 분포: norm 지수 분포: expon 여기에 더해, scipy는 통계 모형에 대한 세밀한 분석을 위한 확률 질량 함수, 확률 밀도 함수와 같은 여러 통계 개념들을 메서드 형태로 제공합니다. cdf 누적 분포 함수 (Cumulative Distribution Function) ppf 누적 분포 함수의 역함수 (Probability Point Func..
최근 NDSS 학회에 publish된 논문들을 둘러보다가 흥미로운 연구를 발견했습니다. 내용을 한 줄로 요약해보면 "이동통신망에서 SIM 박스라는 장비를 이용하는 피싱 사기 집단을 걸러내는 기술"인데요, SIM 박스가 무엇인지 궁금해서 쭉 정독했다가 나름 괜찮은 이슈라고 생각해서 포스팅을 올려봅니다. 관련된 논문 내용은 글 하단에 표시한 자료 링크$^{1)}$를 참고해주세요. 1. SIM 박스가 뭐길래 심(SIM) 박스라는 장비를 들어보신 적 있나요? 유심(USIM) 칩은 그래도 뭔지 아는 분들이 많을 겁니다. 우리나라에서는 유독 USIM이라고 부르는데 다른 국가에서는 심(SIM)카드라고 부르는 게 일반적이라고 합니다. SIM 박스는 여러 장의 SIM 카드를 장착하여 이동통신망에 접근하는 허브(Hub)입..
학교나 회사에 꼭 하나씩은 있는 전산팀, 그곳에서는 우리가 인터넷 상에서 언제, 어디로 접속하는지를 뭘 보고 어떻게 분석하는 걸까요? 본 포스트에서는 네트워크 모니터링에서 빼 놓을 수 없는 기술 NetFlow와 sFlow를 소개드리려 합니다. 1. NetFlow NetFlow는 IP 트래픽의 흐름을 기록하고 분석하는 프로토콜입니다. IT 인프라에 배치되어 있는 각종 라우터, 스위치, 그리고 여러 호스트 사이에서 오가는 패킷들의 메타 정보들이 NetFlow를 통해 가시화될 수 있습니다. 여기에는 트래픽의 순간 발생량, 주요 경로, 패킷 손실률 등과 같은 유용한 정보들이 포함됩니다. 이러한 정보들은 궁극적으로 DDoS와 같은 사이버 공격을 탐지하거나 QoS (Quality of Service) 등을 도입하여..
1. 가상화/클라우드의 역사 흔히 머신(Machine)이라고 하면 컴퓨터나 서버를 가리킵니다. 이 머신들은 하드웨어, 즉 CPU, RAM, 하드디스크, 네트워크 인터페이스 카드 등의 요소들을 자체적으로 갖추고 있으며 바로 그 위에 운영 체제와 애플리케이션이 동작하는 모양새가 일반적으로 상상할 수 있는 머신의 형태입니다. 서버 가상화의 개념은 2000년대 초에 알려지기 시작했습니다. 엔지니어들은 하이퍼바이저(hypervisior)라는 것을 발명했고, 이 하이퍼바이저는 동일한 하드웨어 위에 둘 이상의 운영체제를 올릴 수 있게 되었습니다. 그와 동시에, 하이퍼바이저에서 생성된 각 운영체제들을 특별히 가상 머신(Virtual Machine)으로 부르기 시작했습니다. 대표적인 Hypervisior로는 KVM(Op..