: 텍스트를 요약하기에 앞서 바이너리(Binary)와 Base64에 대해 알아 보겠다.

 

1. 바이너리 파일(Binary file) 이란?

    ● '0'과 '1' 2진수 데이터만으로 인코딩된 파일이다.

    ● 데이터 처리에 효율적이지만 사람이 직접 읽을 수 없다.

    대표적인 확장자 : exe, zip, mp3, jpg, png, dll 등이 있다.

 

2. Base64 란?

    ●  다양한 통신채널을 통해 바이너리 데이터를 안전하게 전송할 수 있게 하는 방법이다.

    ●  화면에 표시되는 ASCⅡ 문자들 써서 표현할 수 있는 가장 큰 진법은 64이다.

 

 : base64, binary, ASCⅡ등 개념이 어렵고 복잡할 수 있다. 간단하게 이야기하면 하나의 문자를 어떻게 표현하는지 그 방식이 다른 것이다. 'A'라는 글자를 1번 사람은 '에이'라고 읽고, 2번 사람은 'A라는 모양의 그림이구나'라고 인식하고, 3번 사람은 '의미없는 낙서'라고 생각할 수 있다. 이 때, 1번 ~ 3번 사람이 각각의 ' base64, binary, ASCⅡ'의 방식이라고 생각하면 된다. 특정 객체를 인식하고 생각하는 방법의 차이인 것이다.

 

3. 인코딩 디코딩은 왜 하는가?

 : 인코딩은 데이터를 압축하거나 형식을 바꿔 저장공간을 절약해준다. 이를 통해 전송시간을 줄이는 데 도움이 된다. 디코딩은 인코딩으로 변환된 데이터를 원래 형태로 돌려 사용자가 알아볼 수 있게 하는 역할을 한다.

 

4. 바이트 문자열의 인코딩.

  : "Hellow world"를 base64로 인코딩할 것이다. base64로 인코딩하기 위해서는 binary 형식이어야한다. 그래서 먼저 ascii로 변환해 binary로 만들어 주고 base64로 인코딩을 진행해야 한다.

import base64

string = "Hellow world"

bstring = string.encode('ascii') # string을 binary로 변경하기 위해 ascii 인코딩한다.
print(bstring)

encode_base64 = base64.b64encode(bstring) # base64로 디코딩한다. 바이너리만 base64 디코딩이 가능하다.
print(encode_base64)
결과

 

5. 문자열의 디코딩.

  : 위에 코드에 이어서 진행한다.

decode_base64 = base64.decodebytes(encode_base64)
print(decode_base64)
결과

 

'업무자동화' 카테고리의 다른 글

1-06. 텍스트 요약 (gensim 01)  (0) 2024.06.19
1-05. 텍스트 요약 (collections.Counter)  (1) 2024.06.18
1-04. 텍스트 요약 (re)  (0) 2024.06.17
1-03. 텍스트 요약 (textwrap)  (0) 2024.06.16
1-01. 텍스트 요약 (개요)  (0) 2024.06.10

 : Python을 이용해 텍스트를 요약하는 프로젝트를 진행할 것이다. 요약하고자 하는 내용을 디코딩한 후 키워드를 추출해서 요약하고 이를 파일로 저장하는 방향으로 프로젝트를 진행할 것이다.

 

1. 가상환경 설정 이유.

   : 각 프로젝트마다 필요한 패키지(파이썬 소스 파일을 모아 둔 것)가 다를 수 있다. 하지만 한 컴퓨터 내에는 다른 버전의 패키지를 가지고 있을 수 없다. 그래서 공간을 분리해서 각 공간에 패키지를 설치하고 이를 불러와 각각의 작업환경을 만드는 것이다.

 

 

2. 가상환경 만들기.

 2.01 우측하단 Launch Profile → Command Prompt 클릭한다.

 

 2.02 TERMINAL 창에 가상환경 이름 설정 후 Enter. (아래에서 가상환경 이름은 "python_basic")

 

 2.03 좌측에 "python_basic" 폴더가 생성되고 "Script" 폴더에 activate 와 deactivate 파일이 생성된다. 아래 처럼 경로와 activate를 입력해주면 가상환경이 활성화 된다.

 

 

3. 가상환경 내에 패키지.

   : 가상환경내에 설치된 패키지를 확인하려면 "pip list"를 입력하면 확인 할 수 있다. 설치를 하려면 "pip install xxxxx)를 입력하면 원하는 패키지가 설치된다.

 

 

4. 파일 생성 후 가상환경에서 열기.

   : 가상환경을 만들면서 생성된 "python_basic" 폴더 안에 "basic01" 폴더를 만들고 "01.test.py"라는 폴더를 만들어 연다. 인터프리터를 설정해야 하는데 아래 이미지의 우측하단 처럼 "3.10.11('python_basic': venv)가 나오면 정상적으로 설정이 된것이다. 만약 이미지 우측하단에 다른게 적혀 있으면 그부분을 클릭한다. 그러면 상단 중앙에 인터프리터를 선택할 수 있다.

 

 

가상환경을 만들고 선택하는 방법을 알아보았다. 

'기초문법' 카테고리의 다른 글

3. 가상환경 설정 (Jupyter notebook)  (0) 2024.07.19
2. 가상환경 설정 (Anaconda + VS code)  (0) 2024.07.01

+ Recent posts