A company collects data for temperature, humidity, and atmospheric pressure in cities across multiple continents. The average volume of data that the company collects from each site daily is 500 GB. Each site has a high-speed Internet connection. The company wants to aggregate the data from all these global sites as quickly as possible in a single Amazon S3 bucket. The solution must minimize operational complexity. Which solution meets these requirements?
A. Turn on S3 Transfer Acceleration on the destination S3 bucket. Use multipart uploads to directly upload site data to the destination S3 bucket.
B. Upload the data from each site to an S3 bucket in the closest Region. Use S3 Cross-Region Replication to copy objects to the destination S3 bucket. Then remove the data from the origin S3 bucket.
C. Schedule AWS Snowball Edge Storage Optimized device jobs daily to transfer data from each site to the closest Region. Use S3 Cross-Region Replication to copy objects to the destination S3 bucket.
D. Upload the data from each site to an Amazon EC2 instance in the closest Region. Store the data in an Amazon Elastic Block Store (Amazon EBS) volume. At regular intervals, take an EBS snapshot and copy it to the Region that contains the destination S3 bucket. Restore the EBS volume in that Region.
날씨 데이터를 모으는 회사. 각 site 별로 500GB 씩 모음. 글로벌 사이트의 데이터를 가능한 한 빨리 하나의 아마존 S3 버킷에 모아야 함. 이때 운영상의 복잡성이 없어야할 때 어떤 해결책이 필요한가?
여러 대륙에 걸친 방대한 양의 파일 수집, 초고속 인터넷 연결, 모든 데이터를 s3 버킷에 집계, 빠른 속도와 복잡도 최소화. 다음과 같은 키워드에 알맞은 해결책은 A이다. S3 transfer Acceleration은 Edage Location을 사용하여 장거리 전송에 걸쳐 전속 속도를 최대 50~ 500% 향상시킬 수 있다.
B와 D는 재해 복구를 위해서 사용하고 C는 로컬 환경과 AWS 클라우드 간 데이터 전송에 사용한다.
A company needs the ability to analyze the log files of its proprietary application. The logs are stored in JSON format in an Amazon S3 bucket. Queries will be simple and will run on-demand. A solutions architect needs to perform the analysis with minimal changes to the existing architecture. What should the solutions architect do to meet these requirements with the LEAST amount of operational overhead?
A. Use Amazon Redshift to load all the content into one place and run the SQL queries as needed.
B. Use Amazon CloudWatch Logs to store the logs. Run SQL queries as needed from the Amazon CloudWatch console.
C. Use Amazon Athena directly with Amazon S3 to run the queries as needed.
D. Use AWS Glue to catalog the logs. Use a transient Apache Spark cluster on Amazon EMR to run the SQL queries as needed.
자사의 app 로그파일을 분석해야 하며, 로그는 JSON 형식으로 저장됨. 쿼리는 간단하고 주문형으로 실행.
정답 C. 키워드는 간단한 쿼리와 주문형, 기존 아키텍쳐의 변경 최소화이다. 아마존 아테나는 표준 SQL을 사용해 S3에서 데이터를 직접 분석할 수 있는 대화형 쿼리 서비스. 표준 SQL을 사용해 애드혹 쿼리를 실행하는 것이므로 Athena가 정답.
A는 모든 컨텐츠를 RedShift에 로드하고 SQL쿼리를 실행해야 함.(복잡한 쿼리는 RedShift)
B는 로그를 분석하고 쿼리를 실행하는 것도 많지만 주문형이 아님
D도 A처럼 단계가 있음. AWS Glue를 사용해 로그를 카탈로그화 하고 Spark를 사용해 SQL 실행함.
A company uses AWS Organizations to manage multiple AWS accounts for different departments. The management account has an Amazon S3 bucket that contains project reports. The company wants to limit access to this S3 bucket to only users of accounts within the organization in AWS Organizations.Which solution meets these requirements with the LEAST amount of operational overhead?
A. Add the aws PrincipalOrgID global condition key with a reference to the organization ID to the S3 bucket policy.
B. Create an organizational unit (OU) for each department. Add the aws:PrincipalOrgPaths global condition key to the S3 bucket policy.
C. Use AWS CloudTrail to monitor the CreateAccount, InviteAccountToOrganization, LeaveOrganization, and RemoveAccountFromOrganization events. Update the S3 bucket policy accordingly.
D. Tag each user that needs access to the S3 bucket. Add the aws:PrincipalTag global condition key to the S3 bucket policy.
서로 다른 부서의 AWS 계정을 관리함. 관리자 계정에는 S3 버킷이 있음. 조직 내 계정의 사용자만 S3 버킷 액세스 제한 해제
정답은 A. PrincipalOrgID는 조직에 속하지 않는 구성원이 리소스에 액세스하는 걸 방지한다.
B도 액세스를 제한할 수 있긴 하지만 더 많은 운영 오버헤드가 필요함.
C로는 사용자 접근을 막을 수 없음. 각 계정을 수동으로 추가해야 하는데다가 새로운 사용자가 추가되는 경우 적용되지 않음.
D도 액세스 제한할 수 있긴 한데 오버헤드남.
An application runs on an Amazon EC2 instance in a VPC. The application processes logs that are stored in an Amazon S3 bucket. The EC2 instance needs to access the S3 bucket without connectivity to the internet. Which solution will provide private network connectivity to Amazon S3?
A. Create a gateway VPC endpoint to the S3 bucket.
B. Stream the logs to Amazon CloudWatch Logs. Export the logs to the S3 bucket.
C. Create an instance profile on Amazon EC2 to allow S3 access.
D. Create an Amazon API Gateway API with a private link to access the S3 endpoint.
S3 버킷에 저장된 로그를 처리하려고 하는데 인터넷 연결을 하면 안됨.
답은 A임. gateway VPC endpoint는 아마존 서비스인 S3버킷에 인터넷 연결 없이 연결 가능함.
B는 Ec2에서 CloudWatch로 VPC endpoint설정이 가능하지만 로그 데이터 보내려면 최대 12시간 소요될 수 있음.
C의 instance profile은 이 문제와 관련이 없음
D는 외부 사이트에서 네트워크를 수신해서 공개적으로 사용 가능한 https 기반 엔드포인트에 전달하는 프록시라 private하지 않아서 틀림
A company is hosting a web application on AWS using a single Amazon EC2 instance that stores user-uploaded documents in an Amazon EBS volume. For better scalability and availability, the company duplicated the architecture and created a second EC2 instance and EBS volume in another Availability Zone, placing both behind an Application Load Balancer. After completing this change, users reported that, each time they refreshed the website, they could see one subset of their documents or the other, but never all of the documents at the same time. What should a solutions architect propose to ensure users see all of their documents at once?
A. Copy the data so both EBS volumes contain all the documents
B. Configure the Application Load Balancer to direct a user to the server with the documents
C. Copy the data from both EBS volumes to Amazon EFS. Modify the application to save new documents to Amazon EFS
D. Configure the Application Load Balancer to send the request to both servers. Return each document from the correct server
한 회사가 사용자가 업로드한 문서를 ec2 하나를 사용해서 저장함. 웹을 호스팅 중. 확장과 가용성을 증가시키기 위해 아키텍처 복재 후 ec2와 ebs를 다른 az에 생성 및 로드 밸런서 뒤에 둠. 그런데 이렇게 설정하니까 새로고침 할 때마다 하위집합을 하나씩 밖에 못 봄(모든 문서 동시에 볼 수 없음)
답은 C. 두 개의 EBS 데이터를 EFS로 복사. EBS는 cross AZ를 지원하지 않지만 EFS느느 하나의 AZ에 상주함. 그니깐 두 ebs의 데이터를 efs로 복사하고 어플리케이션 수정해서 새 문서를 efs로 저장하면 됨.
다른 선택지는 모든 데이터를 한 장소에 저장할 수 없음.
A의 경우엔 두 volumne들을 복사할 때 데이터의 일관성을 보장할 수 없음
B처럼 사용자가 문서와 함께 서버로 이동하면 로드 벨런서가 어떤 서버에 어떤 문서가 저장되어 있는지 알고 있어야 해서 유지 관리하기가 어려움.
D에서 두 서버에 요청하고 두 서버의 응답을 모두 수신하고 처리해야 하서 효율적이지 않음.
'AWS' 카테고리의 다른 글
AWS linux kafka 초기 설정 (0) | 2024.09.20 |
---|---|
[CASE STUDY] 리멤버의 서비스 모니터링 분석 (1) | 2024.01.21 |
[CORE SESSION] Automating Architecture 정리 (0) | 2024.01.05 |
CloudWatch와 x-ray를 통해 관찰 가능성 확보하기 (0) | 2023.12.02 |
[SAA] Associate SAA-C03 5문제 (0) | 2023.12.02 |
댓글