텍스트(text)는 문서를 구성하는 단어 또는 문장들의 집합체이다. 텍스트라는 용어는 라틴어 동사에서 파생된 명사로서 '직물/조직'이라는 뜻이다. 하나의 문서를 마치 직물처럼 촘촘하게 구성하는 단어나 문장의 묶음을 텍스트라고 부른다. 컴퓨터에서 텍스트란 한글이나 알파벳 등 문자로 구성된 파일을 뜻한다. 텍스트 파일의 확장자는 .txt 이다.
텍스트(Text)는 라틴어 Textum(엮다)에서 유래했다. 즉, 글자를 엮으면 'Text(글)'이 된다는 의미이다.[1] 텍스트는 일관되게 엮어진 기호의 복합체로 규정할 수 있다. 좁은 의미의 텍스트는 기호 가운데 특히 구어 혹은 문어 등의 언어로 이루어진 복합체를 뜻한다. 모든 인문과학이 그 대상으로 인간의 사유를 문제삼는다고 할 때, 사유를 표출한 결과물인 텍스트는 인문과학의 유일한 현실적 대상으로 간주될 수 있다는 점에서 그 의미는 지대하다. 롤랑 바르트(Roland Barthes)에 따르면 문학 작품(work)은 공간의 한 부분을 차지하는 실체의 단편이지만, 텍스트는 방법론적인 영역으로 그 자체로는 무의미하며 작업이나 생산에 의해서만 체험될 수 있는 것이다. 이는 전통적인 작품 개념을 텍스트로 대체함으로써 경외하고 찬탄해야 할 대상이 아닌, 적극적으로 분석하고 해석해야 하는 대상으로 전환하는 것이다.
문학 이론에서 텍스트는 이 물체가 문학 작품이든, 거리 표지판이든, 도시 블록의 건물 배치든, 옷 스타일이든 "읽기"가 될 수 있는 어떤 대상이다. 그것은 일종의 유익한 메시지를 전달하는 일관된 표지판이다. 이 기호 집합은 물리적 형태나 그것이 표현되는 매체보다는 정보 메시지의 내용 면에서 고려된다.[2]
문학 비평의 분야 내에서 텍스트는 특정한 글의 원본 정보 내용을 언급한다. 즉, 작품의 "텍스트"는 후에 변경된 내용, 열화, 논편, 번역, 구문 등을 제외하고, 글자의 원시적인 상징적 배열이다. 따라서 문학적 비평이 "텍스트"의 결정과 관련될 때, 주어진 텍스트 문서에 나타나듯이 그 내용에 추가되거나 감산된 원본 정보 내용을 구별하는 것과 관련이 있다.(텍스트의 물리적 표현)
글의 역사는 "텍스트"의 개념을 앞지르기 때문에, 대부분의 텍스트는 이 개념을 염두에 두고 쓰여지지 않았다. 대부분의 저술은 텍스트 이론에 의해 기술된 유형의 좁은 범위 안에 든다. "텍스트"의 개념은 "정확한 서면 메시지가 작성되고 작성된 상황과 무관하게 참조될 필요가 있는 경우 및 그 때 관련성이 있게 된다.
언어학[편집]
텍스트 언어학은 텍스트를 통신 시스템으로 다루는 언어학의 한 분야이다. 텍스트의 원래 목표는 텍스트 그래머를 발견하고 설명하는 데 있었다. 그러나 텍스트 언어학의 적용은 이 접근법에서 텍스트 전체를 향한 전통적인 문법의 단순한 확장을 넘어 훨씬 더 넓은 용어로 텍스트가 보이는 지점으로 발전했다. 텍스트 언어학은 텍스트의 형태 즉, 상호작용적이고 의사소통적인 문맥에 위치한 방식도 고려한다. 텍스트의 작성자 및 추가자 모두 특정 의사소통 맥락에서 각자의(사회적 및 제도적) 역할에서 고려된다. 일반적으로 텍스트는 문장이나 단어에 그치지않고 훨씬 더 광범위한 수준의 담화 분석을 적용한 것이다.[3]
텍스트 파일[편집]
텍스트 파일은 컴퓨터 파일 시스템에서 컴퓨터 파일의 일종이다. 일반 문자열이 들어가는 파일이지만, 저장 정보의 해석 방식, 운영 체제와 연결되는 프로그램의 방식에 따라 이진 파일과 구분한다. 텍스트 파일은 사람이 인지할 수 있는 문자열 집합으로부터 문자열로만 이루저인다. 잘 알려진 문자열 집합으로는 ASCII 문자열 집합과 유니코드 문자열 집합이 있다.[4]
인코딩[편집]
ASCII 문자 집합이 영어 텍스트 파일의 가장 보편적인 포맷이며, 수많은 상황에서 일반적으로 기본 파일 포맷으로 간주할 수 있다. 강세가 있는 문자와 기타 비 ASCII 문자의 경우 문자 인코딩을 선택할 필요가 있다. 수많은 시스템에서는 컴퓨터에서 읽기 위해 쓰이는 기본 로캘 설정에 기초하여 선택된다. 수많은 유럽 언어에서 보편적인 문자 인코딩은 ISO 8859-1을 포함한다.
수많은 인코딩들이 제한된 문자열들만을 보유하고 있기 때문에 제한된 하위 집합의 인간 언어로 텍스트를 표현할 때에만 종종 유용하다. 유니코드는 알려진 모든 언어를 대표하기 위한 공통 표준을 만드는 시도로 볼 수 있으며, 알려진 대부분의 문자 집합들이 매우 큰 유니코드 문자 집합의 하위 집합에 속해있다. 유니코드를 위한 복수의 문자 인코딩이 있지만, 가장 흔한 것은 UTF-8이며, ASCII와 하위 호환된다는 장점이 있다. 즉, 비슷한 의미로 모든 ASCII 텍스트 파일은 UTF-8 텍스트 파일이기도 한다.
수많은 운영 체제에서 텍스트 파일은 서식(굵게 또는 기울임 등과 같은)이 없는 플레인 텍스트 내용만 허용하는 파일 포맷을 가리킨다. 이러한 파일들은 텍스트 터미널이나 문서 편집기를 통해 확인, 편집이 가능하다. 텍스트 파일들은 보통 MIME 텍스트/플레인을 가지며, 인코딩을 가리키는 추가적인 정보가 포함되는 것이 보통이다.
윈도우 텍스트 파일[편집]
MS-DOS와 윈도우는 동일한 텍스트 파일 포맷을 사용하며, 각 텍스트 줄은 2개의 문자 조합으로 구분된다.
유닉스 텍스트 파일[편집]
유닉스 계열 운영 체제에서 텍스트 파일 포맷은 정확하게 기술되어 있다. POSIX는 텍스트 파일을 0개 이상의 줄로 조직된 문자들을 포함하는 파일로 정의하고 있으며, 여기에서 줄들은 0개 이상의 새줄이 아닌 문자들 및 보통 LF를 가리키는 종단 새줄 문자로 이루어진다.
플레인 텍스트[편집]
플레인 텍스트(Plain text)는 그래픽 표현이나 그 밖의 오프젝트(그림 등)이 아닌, 읽을 수 있는 자료의 문자열만을 대표하는 데이터이다. 플레인 텍스트는 양식 정보가 포함된 리치 텍스트, 일부분이 이진 오브젝트(인코딩된 정수, 실수, 그림 등)로 대표되는 바이너리 파일과는 구별된다.[5]
텍스트 터미널[편집]
텍스트 터미널(text terminal) 또는 텍스트 콘솔(text console)은 텍스트 입력 및 표시를 위한 직렬 컴퓨터 인터페이스이다. 정보는 미리 선택된 문자 배열로 보여 준다. 이러한 장치들이 음극선관(CRT)과 같은 비디오 디스플레이를 이용할 때 "비디오 디스플레이 장치"(VDU) 또는 "비디오 디스플레이 터미널"(VDT)로 부른다.[6]
하이퍼텍스트[편집]
하이퍼텍스트(hypertext)는 컴퓨터 디스플레이나 독자가 즉시 액세스할 수 있는 다른 텍스트에 대한 참조(하이퍼 링크)가 있는 기타 전자 장치에 표시되는 텍스트이다. 하이퍼텍스트 문서는 일반적으로 마우스 클릭, 키 누르기 세트 또는 화면 터치에 의해 활성화되는 하이퍼 링크로 상호 연결된다. 텍스트 이외에도 "하이퍼텍스트"라는 용어는 때때로 하이퍼 링크가 통합된 표, 이미지 및 기타 프리젠테이션 콘텐츠 형식을 설명하는 데 사용된다.
하이퍼텍스트는 최근 주화이다. '하이퍼'는 '과도한'(과잉 행동)의 의학적 의미보다는 수학적 확장 및 일반성(하이퍼 스페이스, 하이퍼 큐브와 같은)에 사용된다. 크기에 대한 의미는 없다. 하이퍼텍스트는 500단어 정도만 포함할 수 있다. '하이퍼'는 크기가 아닌 구조를 나타낸다.
하이퍼텍스트 용어는 'hyper(초월한)'와 'text(문서)'의 합성어로, 1960년대 미국 철학자 '테드 넬슨(Ted Nelson)이 구상한 용어이다. 영어 접두사 "hyper-"는 그리스어 접두사 "ὑπερ-"에서 유래하며 "over"또는 "beyond"를 의미한다. 라인터에서 유래한 접두사 "super-"가 있는 공통 원점을 가지고 있다. 테드 넬슨은 하시퍼텍스트를 현실화하기 위해 '재나두 프로젝트(Project Xanadu)'를 진행했다. 재나두 프로젝트란 세상의 모든 정보를 모아 서로 연계되고 이어지는 정보의 흐름을 만들자는 프로젝트다. 이 프로젝트는 훗날 팀 버나스 리(Tim Beners-Lee)가 인터넷의 기반인 '월드 와이드 웹(WWW)'을 개발하는 데 큰 영향을 줬다. 하이퍼텍스트에 대해 자세히 보기
참고 자료[편집]
같이 보기[편집]
이 텍스트 문서는 사무자동화에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
개발 : 프로그래밍, 소프트웨어, 데이터, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화 □■⊕, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
문서
|
가운데점 • 가운데정렬 • 각주 • 검토 • 구두점 • 굵게 • 그림 • 글 • 글꼴 • 글씨 • 글자 • 글자모양 • 글자색 • 글자체 • 글자크기 • 글자판 • 기울임 • 기호 • 꼬리말 • 내어쓰기 • 느낌표 • 다단 • 단어 • 대문자 • 도형 • 되돌리기 • 들여쓰기 • 띄어쓰기 • 마침표 • 맞춤법 • 머리말 • 메모 • 목차 • 문단 • 문단모양 • 문서 • 문자 • 문자표 • 문장 • 물음표 • 밑줄 • 바탕글 • 반각 • 배경 • 보기 • 복붙 • 복사 • 복원 • 본문 • 부호 • 불러오기 • 붙여쓰기 • 붙이기 • 사본 • 삭제 • 새문서 • 생성 • 서류 • 서식 • 선택 • 소문자 • 수정 • 숨김 • 숫자 • 쉼표 • 스타일 • 쌍점 • 양쪽정렬 • 언어 • 엔터 • 여백 • 오른쪽정렬 • 왼쪽정렬 • 원본 • 이동 • 자간 • 자료 • 자르기 • 장평 • 저장 • 전각 • 점 • 점자 • 정렬 • 조판부호 • 주석 • 주해 • 줄 • 줄간격 • 줄바꿈 • 진하게 • 쪽 • 차례 • 차트 • 참고자료 • 찾기 • 첨자 • 체크 • 축소 • 출처 • 취소선 • 칸 • 탭 • 테두리 • 특수문자 • 페이지 • 편집 • 폰트 • 표 • 프린트 • 필드 • 확대
|
|
파일
|
CSV • PDF • 디렉토리 • 아래아한글 • 엑셀 • 워드 • 텍스트 • 파워포인트 • 파일 • 폴더
|
|
사무자동화(OA) 기술
|
계정 • 끄기 • 다시 시작 • 동기화 • 드래그 • 드래그앤드롭 • 디렉터리 • 디스플레이 • 모드 • 미리보기 • 버전 • 볼륨 • 부팅 • 스크롤 • 시스템 종료 • 알림 • 압축 • 앱 • 야간모드 • 용량 • 용지 • 위지위그 • 인쇄 • 입력 • 장치 • 전원 • 절전 • 주간모드 • 창 • 첨부 • 첨부파일 • 출력 • 켜기 • 클릭 • 클립보드 • 타이핑 • 파일 • 파일할당표(FAT) • 포맷 • 폴더 • 해상도 • 화면 • 화면잠금 • 확장자 • 휴지통
|
|
사무자동화(OA) 제품
|
그림판 • 마이크로소프트 오피스 • 메모장 • 스프레드시트 • 아래아한글 • 알집 • 액세스 • 엑셀 • 오픈오피스 • 오픈캡쳐 • 오피스 • 워드 • 워드프로세서 • 일러스트레이터 • 파워포인트 • 포토샵 • 프레젠테이션 • 한컴오피스
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|
개발 : 프로그래밍 □■⊕, 소프트웨어, 데이터, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
프로그래밍 언어
|
ASP • C 언어 • C++ • C# • CSS • D 언어 • HTML • HTML5 • JSP • PHP • R • XHTML • XML • XSLT • 고(Go) • 고급언어 • 기계어 • 델파이 • 러스트 • 루비 • 루아 • 리액트 • 리퀴디티 • 무브 • 미켈슨 • 베이직 • 브이비스크립트 • 비주얼 C++ • 비주얼베이직(VB) • 비주얼베이직닷넷(VB.NET) • 솔리디티 • 스몰토크 • 스위프트 언어 • 스칼라 • 스크립트 언어 • 알골 • 어셈블리 • 언리얼스크립트 • 얼랭 • 에이잭스(Ajax) • 엠에프씨(MFC) • 오브젝티브-C • 오브젝트 파스칼 • 오카멜 • 웹어셈블리(WASM) • 이와즘(eWASM) • 자바 • 자바스크립트 • 저급언어 • 제이슨(JSON) • 제이쿼리(jQuery) • 카멜 • 코볼 • 코틀린 • 콜드퓨전 • 타입스크립트 • 파스칼 • 파워스크립트 • 파이썬 • 펄(Perl) • 포트란 • 프로씨(Pro-C) • 피엘에스큐엘(PL/SQL) • 피엘원(PL/I) • 하스켈
|
|
개발방법론
|
CBD 개발방법론 • EA • 구조적 개발방법론 • 객체지향 개발방법론 • 라이브러리 • 람다 아키텍처 • 모듈 • 모듈화 • 벤치마킹 • 소프트웨어 개발방법론 • 스크럼 • 스프린트 • 아키텍처 • 아키텍트 • 애자일 • 웹개발방법론 • 정보공학 개발방법론 • 컴포넌트 • 테일러링 • 템플릿 • 폭포수 모델 • 프로젝트 • 프로토타입 • 피드백
|
|
코딩
|
EUC-KR • UTF-8 • 값 • 글루웨어 • 노팔로우 링크 • 두팔로우 링크 • 디버깅 • 디코딩 • 마크업 • 버그 • 부트스트랩 • 세이브포인트 • 소스코드 • 시큐어코딩 • 아스키 • 액티브엑스 • 오픈소스 • 유니코드 • 인코딩 • 재컴파일 • 주석 • 컴파일 • 컴퓨터 프로그램 • 코드 • 코딩 • 태그 • 테스트 • 테이블 • 텍스트 • 파싱 • 퍼블리싱 • 퓨니코드 • 하드코딩 • 하이퍼링크 • 하이퍼텍스트
|
|
프로그래밍
|
C 명령어 • 객체 • 객체지향 • 객체지향 프로그래밍 • 거짓 • 관계연산자 • 기본형 변수 • 널 • 논리 • 논리연산 • 논리연산자 • 다중상속 • 다형성 • 대입 • 대입문 • 대입연산자 • 더블 • 도스 명령어 • 디폴트 • 레지스터변수 • 루프 • 리눅스 명령어 • 리턴 • 메모리 주소 • 메소드 • 멤버 • 명령문 • 명령어 • 무한루프 • 문자 • 문자열 • 바이트 • 반복문 • 배열 • 변수 • 분기 • 분기문 • 불린 • 브레이크 • 비교연산자 • 비트연산자 • 산술연산자 • 상속 • 상수 • 생성자 • 선언 • 선언문 • 설정자 • 속성 • 스위치 • 스태틱 • 시프트연산자 • 실행 • 실행문 • 어노테이션 • 에코 • 역참조 • 연산 • 연산문 • 연산자 • 오버로딩 • 오버라이딩 • 외부변수 • 윈도우 명령어 • 유닉스 명령어 • 인스턴스 • 인스트럭션 • 인클루드 • 인터페이스 • 임포트 • 입력 • 입력문 • 입출력 • 입출력문 • 자료형(데이터 타입) • 자바 명령어 • 자바 예약어 • 자바 컬렉션 • 전역변수 • 접근자 • 접근제어자 • 정보은닉 • 정수형 • 정적변수 • 제어 • 제어문 • 제어자 • 조건 • 조건문 • 조건연산자 • 주소 • 증감연산자 • 지역변수 • 참 • 참조 • 참조변수 • 초기화 • 추상메소드 • 추상클래스 • 추상화 • 출력 • 출력문 • 캡슐화 • 케이스 • 클래스 • 파라미터(매개변수) • 파이널 • 패키지 • 퍼블릭 • 포인터 • 프라이빗 • 프로텍티드 • 필드(멤버변수) • 함수 • 환경변수
|
|
명령어
|
abstract • array • boolean • break • byte • case • char • continue • default • double • do while • echo • elif • else • else if • false • final • float • for • gosub • goto • if • if else • import • include • int • join • long • long long • null • print • printf • println • private • protected • public • return • scanf • short • stdio.h • static • string • switch • temp • then • true • unsigned • void • while
|
|
디자인패턴
|
구조패턴 • 동시성패턴 • 동시실행패턴 • 모델-뷰-컨트롤러 패턴 • 상태패턴 • 생성패턴 • 싱글톤패턴 • 아키텍처패턴 • 전략패턴 • 커맨드패턴 • 행동패턴
|
|
프로그래밍 인물
|
귀도 반 로썸 • 그레이스 머레이 호퍼 • 니클라우스 비르트 • 댄 브릭클린 • 더그 커팅 • 데니스 리치 • 리누스 토르발스 • 리처드 그린블라트 • 마거릿 해밀턴 • 마크 앤드리슨 • 빈트 서프 • 빌 게이츠 • 빌 조이 • 스티브 잡스 • 에이다 러브레이스 • 제임스 고슬링 • 척 벤턴 • 켄 톰슨 • 팀 패터슨
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|
인공지능 : 인공지능 서비스, 인공지능 로봇, 인공지능 기술 □■⊕, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • TTS • URL • 글자 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문서 • 문자 • 문자인식 • 문자채팅 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 이미지 • 인공어 • 인공지능 음성 • 자막 • 자연어 • 질문 • 채팅 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
데이터라벨러 • 데이터라벨링 • 데이터셋 • 돌마 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 임베딩 • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 확률적 경사하강법
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • RAG • XAI • 가중치 • 관계형 네트워크(RN) • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 생성대립신경망(GAN) • 생성형 AI • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 역전파 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 제한 볼츠만 머신(RBM) • 전방전달신경망 • 주의 메커니즘 • 코헨 자기조직 신경망 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 합성곱 신경망(CNN)
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 알렉스넷 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|