프로그래밍13 Selenium. 특정 텍스트 포함 찾기 및 클릭 with xpath 1) 해당 문자열의 상위 xpath 찾아와서 문자열이 포함될 class 까지 찾아오고 xpath 뒤에 //태그명[검색내용] 루트로 코드 작성하면됨. 1. 특정문자열과 전체 일치 - 아래 예시 : 어떤 경로 하위의 a 태그 안에서 멀티코린이라는 문자열과 일치하는 경우만 찾아온다 xpath="""//*[@id="abc"]//a[text()='멀티코린']""" title_text = driver.find_element_by_xpath(xpath) title_text.click() 2. 내용 중 특정 문자열을 포함하는 케이스 - 아래 예시 : 어떤 경로 하위의 a 태그 안에서 멀티라는 문자열이 포함된 경우를 찾아온다 xpath="""//*[@id="abc"]//a[contains(text(),'멀티')]""" .. 2022. 7. 28. Selenium 활용, 예제 기록 2022.03.26 - [프로그래밍/Python] - Selenium 기본기 및 참고 코드 Sample1. Remember. Country 생성하는 방법 유용하다고 생각됨. from selenium import webdriver with webdirver.Firefox() as driver: driver.get('https://www.scrapethissite.com/pages/simple/') # 해당 페이지에서 국가, 수도, 인구, 면적을 모두 추출해 온다. class Country: def __init__(self, name, capital, population, area): self.name = name self.capital= capital self.population = int(populati.. 2022. 3. 26. Selenium 기본기 및 참고 코드 웹 크롤링이란? 웹 사이트를 방문하여 정보를 읽어오는 작업을 뜻함. 보통 HTML 내의 정보를 가져오게 된다. (html, css에 대한 선행 이해 필요) Selenium 동작 #보통 시작하기 위해서 from selenium import webdriver with driver.Firefox() as driver: driver.get('url') ## 이후 부터는 찾을 요소, 로직 작성해서 결과 도출 코드 작성. 요소가 단수인가?복수인가? element vs elements 요소를 선택할 방법은? 요소 선택 방법 tag, class, id, xpath 중에 본인이 판단하여 가장 좋은 방법으로 코드를 작성하면 됨. #tag로 찾을 시 drvier.find_element_by_tag_name() #class로.. 2022. 3. 26. 직장인 Excel 꿀팁 : 엑셀 행열 바꿔 값만 붙여넣기 단축키 업무를 하다보면 종종 단순 노동을 해야할 때가 있지만 조금만 머리를 열심히 굴리면 나의 단순 노동을 빠르게 끝내고 시간을 절약할 수 있다. 그 중 하나가 알아두면 좋은 것이 엑셀 단축키 이고 오늘 알아 볼 것은 행/열 바꿈 기능의 창을 단축키로 띄우고 여러개를 고르는 걸 단축키로 샤샥 빠르게 하는 팁이다! 종종 아래처럼 다양한 서식이 지정되어 있는 값을 서식은 빼고 값만! 행/열을 바꿔서 가져오고 싶을 때가 있는데 이제 꿀팁 방출! 우선, 내가 복사하고자하는 값에 드래그 + Ctrl+c 붙여넣고자하는 셀에 커서를 옮겨두고 Ctrl+Alt+v 하면 아래와 같이 선택하기 붙여넣기 창이 뜬다 여기서 내가 적용하고자하는 옵션옆의 알파벳을 누르면 되고 나처럼 값만, 행/열 바꿈을 적용하기 원한다면 v , e를 누.. 2021. 9. 4. 하둡(Hadoop)이란? 하둡(Hadoop) 대규모 검색 색인을 구축하기 위해 자바로 개발된 오픈 소스 분산 컴퓨팅 플랫폼 초창기 개발 목적은 검색 색인 이였으나 이후 일반적인 다른 문제에도 폭넓게 적용되어 사용되고 있음. 여러 개선 과정을 거쳐 현재는 대규모 rawdata를 처리하고 분석하는 데이터 센터 운영 시스템의 핵심 소프트웨어 생태계이다. 하둡의 구성 요소 1/ 분산 파일 시스템 : HDFS HDFS(Hadoop Distributed File System)이 가장 널리 사용되고 있으며 데이터의 중복 저장이란 개념을 바탕으로 한 대규모 분산 파일 시스템 일반적인 파일 시스템을 가진 여러 노드를 묶어 하나의 분산 파일 시스템을 구축하도록 설계되어 파일 시스템을 손쉽게 확장해 몇 페타바이트에 이르는 대용량 데이터까지 저장이 .. 2020. 11. 8. Html : 티스토리 서식 구성을 위한 기본, 텍스트 관련 태그 태그 - 문서 정보 태그 - 문자 인코딩 및 문서 키워드, 요약 정보 * 언어 표시 방식을 utf-8 방식으로 채택. 1 2 3 cs 태그 - 화면에 보일 내용 태그 - 제목 작성 - 예시/ 태그 - 단락만들기 - 더 쉬운 의미로는 줄바꿈이 있는 텍스트라고 생각하면 됨. 하나의 단락, 단락 태그 - 줄바꿈 - Enter와 같은 의미로 보아도 됨. 태그 - 수평 줄 삽입 - css를 사용해 여러가지 스타일의 줄 삽입이 가능 - 닫는 태그 없음 태그 - 인용문 넣기 태그 - 입력한 그대로 화면에 표시 - 원래 html은 아무리 많은 공백을 넣더라도 브라우저 창에는 한 개의 공백만 표시됨. 하지만 태그를 사용할 경우 화면에 입력한 그대로 내용이 노출될 수 있음. 안에 목록 생성하기 , 태그 - 순서 없는 목록.. 2020. 10. 25. HTML 코드 온라인에서 바로 보기 : CodePen html 코드를 작성하고 웹으로 옮겨보는 게 아니라 코드 작성 즉시 확인을 하고 싶다면 아래 사이트에서 확인이 가능하다. CodePen codepen.io/pen/나도 우연찮게 검색을 하다가 발견했는데 너무나도 편리하다. 티스토리 스킨을 내입맛대로 편집을 하고 싶은데 입력하고 확인해오고 수정하는게 너무 번거로워서 계속 작업을 미루고 있었다. 그런데 CodePen을 이용하니 색상, 글꼴 등 작성한 모든 것을 한 번에 즉시즉시 실시간으로 변환해서 보여준다. Create a New Pen ... codepen.io 티스토리 스킨 편집을 위해 html을 처음 접하는 사람도 별도의 설치 혹은 구현 과정 없이 CodePen 사이트에서 코드를 입력하고 바로 결과 확인을 할 수 있다. Codepen 사이트에는 이렇게 .. 2020. 10. 11. Python : 여러개의 DataFrame을 각 시트별로 엑셀 파일에 저장 DataFrame의 내용을 엑셀 파일에 저장하는 방법 dataframe을 엑셀 파일로 저장하게 위해서는 아래의 프로세스 대로 파일 생성 > dataframe 값 넣기 > 파일 저장 의 순으로 진행 되면 된다. 마치, 우리가 엑셀을 열고 > 내용을 작성하고 > 저장버튼을 누르기까지의 과정이 코드화 된 것이라고 이해해도 좋다. 1 2 3 4 5 6 7 8 9 10 11 12 13 df1=[1:4] #1. 파일 생성 writer=pd.ExcelWriter('테스트파일명.xlsx', engine='openpyxl') #2. 생성 파일에 시트명 지정 후 dataframe에 저장한 결과값 넣기 df1.to_excel(writer, sheet_name='sheet1') #3. 작성 완료 후 파일 저장 writer.s.. 2020. 10. 8. 이전 1 2 다음