2 лет назад · 79ac246211
--- a/src/sentry/replays/consumers/recording/process_recording.py
+++ b/src/sentry/replays/consumers/recording/process_recording.py
@@ -6,8 +6,6 @@ import random
 
				 import time
			
 
				 from collections import deque
			
 
				 from concurrent.futures import Future
			
 
				-from datetime import datetime, timezone
			
 
				-from io import BytesIO
			
 
				 from typing import Callable, Deque, Mapping, MutableMapping, NamedTuple, Optional, cast
			
 
				 
			
 
				 import msgpack
			
@@ -17,22 +15,16 @@ from arroyo.backends.kafka.consumer import KafkaPayload
 
				 from arroyo.processing.strategies.abstract import ProcessingStrategy
			
 
				 from arroyo.types import Message, Position
			
 
				 from django.conf import settings
			
 
				-from django.db.utils import IntegrityError
			
 
				 from sentry_sdk.tracing import Transaction
			
 
				 
			
 
				-from sentry.constants import DataCategory
			
 
				-from sentry.models import File
			
 
				-from sentry.models.project import Project
			
 
				-from sentry.replays.cache import RecordingSegmentCache, RecordingSegmentParts
			
 
				-from sentry.replays.consumers.recording.types import (
			
 
				+from sentry.replays.cache import RecordingSegmentParts
			
 
				+from sentry.replays.usecases.ingest import (
			
 
				     RecordingSegmentChunkMessage,
			
 
				-    RecordingSegmentHeaders,
			
 
				     RecordingSegmentMessage,
			
 
				+    ingest_chunk,
			
 
				+    ingest_chunked_recording,
			
 
				 )
			
 
				-from sentry.replays.models import ReplayRecordingSegment
			
 
				-from sentry.signals import first_replay_received
			
 
				-from sentry.utils import json, metrics
			
 
				-from sentry.utils.outcomes import Outcome, track_outcome
			
 
				+from sentry.utils import metrics
			
 
				 
			
 
				 logger = logging.getLogger("sentry.replays")
			
 
				 
			
@@ -67,151 +59,13 @@ class ProcessRecordingSegmentStrategy(ProcessingStrategy[KafkaPayload]):
 
				         self.__commit_data: MutableMapping[Partition, Position] = {}
			
 
				         self.__last_committed: float = 0
			
 
				 
			
 
				-    @metrics.wraps("replays.process_recording.process_chunk")
			
 
				-    def _process_chunk(
			
 
				-        self,
			
 
				-        message_dict: RecordingSegmentChunkMessage,
			
 
				-        message: Message[KafkaPayload],
			
 
				-        current_transaction: Transaction,
			
 
				-    ) -> None:
			
 
				-        cache_prefix = replay_recording_segment_cache_id(
			
 
				-            project_id=message_dict["project_id"],
			
 
				-            replay_id=message_dict["replay_id"],
			
 
				-            segment_id=message_dict["id"],
			
 
				-        )
			
 
				-
			
 
				-        part = RecordingSegmentCache(cache_prefix)
			
 
				-        with current_transaction.start_child(op="replays.process_recording.store_chunk"):
			
 
				-            part[message_dict["chunk_index"]] = message_dict["payload"]
			
 
				-        current_transaction.finish()
			
 
				-
			
 
				-    @metrics.wraps("replays.process_recording.store_recording.process_headers")
			
 
				-    def _process_headers(
			
 
				-        self, recording_segment_with_headers: bytes
			
 
				-    ) -> tuple[RecordingSegmentHeaders, bytes]:
			
 
				-        # split the recording payload by a newline into the headers and the recording
			
 
				-        try:
			
 
				-            recording_headers, recording_segment = recording_segment_with_headers.split(b"\n", 1)
			
 
				-        except ValueError:
			
 
				-            raise MissingRecordingSegmentHeaders
			
 
				-        return json.loads(recording_headers), recording_segment
			
 
				-
			
 
				-    @metrics.wraps("replays.process_recording.store_recording")
			
 
				     def _store(
			
 
				         self,
			
 
				         message_dict: RecordingSegmentMessage,
			
 
				         parts: RecordingSegmentParts,
			
 
				         current_transaction: Transaction,
			
 
				     ) -> None:
			
 
				-        with current_transaction.start_child(
			
 
				-            op="replays.process_recording.store_recording", description="store_recording"
			
 
				-        ):
			
 
				-            with metrics.timer("replays.process_recording.store_recording.read_segments"):
			
 
				-                try:
			
 
				-                    recording_segment_parts = list(parts)
			
 
				-                except ValueError:
			
 
				-                    logger.exception("Missing recording-segment.")
			
 
				-                    return None
			
 
				-
			
 
				-            try:
			
 
				-                headers, parsed_first_part = self._process_headers(recording_segment_parts[0])
			
 
				-            except MissingRecordingSegmentHeaders:
			
 
				-                logger.warning(f"missing header on {message_dict['replay_id']}")
			
 
				-                return
			
 
				-
			
 
				-            # Replace the first part with itself but the headers removed.
			
 
				-            recording_segment_parts[0] = parsed_first_part
			
 
				-
			
 
				-            # The parts were gzipped by the SDK and disassembled by Relay. In this step we can
			
 
				-            # blindly merge the bytes objects into a single bytes object.
			
 
				-            recording_segment = b"".join(recording_segment_parts)
			
 
				-
			
 
				-            with metrics.timer("replays.process_recording.store_recording.count_segments"):
			
 
				-                count_existing_segments = ReplayRecordingSegment.objects.filter(
			
 
				-                    replay_id=message_dict["replay_id"],
			
 
				-                    project_id=message_dict["project_id"],
			
 
				-                    segment_id=headers["segment_id"],
			
 
				-                ).count()
			
 
				-
			
 
				-            if count_existing_segments > 0:
			
 
				-                with sentry_sdk.push_scope() as scope:
			
 
				-                    scope.level = "warning"
			
 
				-                    scope.add_attachment(bytes=recording_segment, filename="dup_replay_segment")
			
 
				-                    scope.set_tag("replay_id", message_dict["replay_id"])
			
 
				-                    scope.set_tag("project_id", message_dict["project_id"])
			
 
				-
			
 
				-                    logging.exception("Recording segment was already processed.")
			
 
				-
			
 
				-                parts.drop()
			
 
				-
			
 
				-                return
			
 
				-
			
 
				-            # create a File for our recording segment.
			
 
				-            recording_segment_file_name = f"rr:{message_dict['replay_id']}:{headers['segment_id']}"
			
 
				-            with metrics.timer("replays.store_recording.store_recording.create_file"):
			
 
				-                file = File.objects.create(
			
 
				-                    name=recording_segment_file_name,
			
 
				-                    type="replay.recording",
			
 
				-                )
			
 
				-            with metrics.timer("replays.store_recording.store_recording.put_segment_file"):
			
 
				-                file.putfile(
			
 
				-                    BytesIO(recording_segment),
			
 
				-                    blob_size=settings.SENTRY_ATTACHMENT_BLOB_SIZE,
			
 
				-                )
			
 
				-
			
 
				-            try:
			
 
				-                # associate this file with an indexable replay_id via ReplayRecordingSegment
			
 
				-                with metrics.timer("replays.store_recording.store_recording.create_segment_row"):
			
 
				-                    ReplayRecordingSegment.objects.create(
			
 
				-                        replay_id=message_dict["replay_id"],
			
 
				-                        project_id=message_dict["project_id"],
			
 
				-                        segment_id=headers["segment_id"],
			
 
				-                        file_id=file.id,
			
 
				-                        size=len(recording_segment),
			
 
				-                    )
			
 
				-            except IntegrityError:
			
 
				-                # Same message was encountered more than once.
			
 
				-                logger.warning(
			
 
				-                    "Recording-segment has already been processed.",
			
 
				-                    extra={
			
 
				-                        "replay_id": message_dict["replay_id"],
			
 
				-                        "project_id": message_dict["project_id"],
			
 
				-                        "segment_id": headers["segment_id"],
			
 
				-                    },
			
 
				-                )
			
 
				-
			
 
				-                # Cleanup the blob.
			
 
				-                file.delete()
			
 
				-
			
 
				-            # delete the recording segment from cache after we've stored it
			
 
				-            with metrics.timer("replays.process_recording.store_recording.drop_segments"):
			
 
				-                parts.drop()
			
 
				-
			
 
				-            # TODO: how to handle failures in the above calls. what should happen?
			
 
				-            # also: handling same message twice?
			
 
				-
			
 
				-            # TODO: in join wait for outcomes producer to flush possibly,
			
 
				-            # or do this in a separate arroyo step
			
 
				-            # also need to talk with other teams on only-once produce requirements
			
 
				-            if headers["segment_id"] == 0 and message_dict.get("org_id"):
			
 
				-                project = Project.objects.get_from_cache(id=message_dict["project_id"])
			
 
				-                if not project.flags.has_replays:
			
 
				-                    first_replay_received.send_robust(project=project, sender=Project)
			
 
				-
			
 
				-                track_outcome(
			
 
				-                    org_id=message_dict["org_id"],
			
 
				-                    project_id=message_dict["project_id"],
			
 
				-                    key_id=message_dict.get("key_id"),
			
 
				-                    outcome=Outcome.ACCEPTED,
			
 
				-                    reason=None,
			
 
				-                    timestamp=datetime.utcfromtimestamp(message_dict["received"]).replace(
			
 
				-                        tzinfo=timezone.utc
			
 
				-                    ),
			
 
				-                    event_id=message_dict["replay_id"],
			
 
				-                    category=DataCategory.REPLAY,
			
 
				-                    quantity=1,
			
 
				-                )
			
 
				-        current_transaction.finish()
			
 
				+        ingest_chunked_recording(message_dict, parts, current_transaction)
			
 
				 
			
 
				     def _process_recording(
			
 
				         self,
			
@@ -219,7 +73,6 @@ class ProcessRecordingSegmentStrategy(ProcessingStrategy[KafkaPayload]):
 
				         message: Message[KafkaPayload],
			
 
				         current_transaction: Transaction,
			
 
				     ) -> None:
			
 
				-
			
 
				         cache_prefix = replay_recording_segment_cache_id(
			
 
				             project_id=message_dict["project_id"],
			
 
				             replay_id=message_dict["replay_id"],
			
@@ -264,12 +117,12 @@ class ProcessRecordingSegmentStrategy(ProcessingStrategy[KafkaPayload]):
 
				                     # as msgpack will decode it as a utf-8 python string
			
 
				                     message_dict["payload"] = message_dict["payload"].encode("utf-8")
			
 
				 
			
 
				-                self._process_chunk(
			
 
				-                    cast(RecordingSegmentChunkMessage, message_dict), message, current_transaction
			
 
				-                )
			
 
				-            if message_dict["type"] == "replay_recording":
			
 
				+                ingest_chunk(cast(RecordingSegmentChunkMessage, message_dict), current_transaction)
			
 
				+            elif message_dict["type"] == "replay_recording":
			
 
				                 self._process_recording(
			
 
				-                    cast(RecordingSegmentMessage, message_dict), message, current_transaction
			
 
				+                    cast(RecordingSegmentMessage, message_dict),
			
 
				+                    message,
			
 
				+                    current_transaction,
			
 
				                 )
			
 
				         except Exception:
			
 
				             # avoid crash looping on bad messsages for now
			
--- a/src/sentry/replays/consumers/recording/types.py
+++ b/src/sentry/replays/consumers/recording/types.py
@@ -1,29 +0,0 @@
 
				-from __future__ import annotations
			
 
				-
			
 
				-from typing import TypedDict
			
 
				-
			
 
				-
			
 
				-class ReplayRecordingSegment(TypedDict):
			
 
				-    chunks: int  # the number of chunks for this segment
			
 
				-    id: str  # a uuid that individualy identifies a recording segment
			
 
				-
			
 
				-
			
 
				-class RecordingSegmentHeaders(TypedDict):
			
 
				-    segment_id: int
			
 
				-
			
 
				-
			
 
				-class RecordingSegmentChunkMessage(TypedDict):
			
 
				-    payload: bytes
			
 
				-    replay_id: str  # the uuid of the encompassing replay event
			
 
				-    id: str  # a uuid that individualy identifies a recording segment
			
 
				-    project_id: int
			
 
				-    chunk_index: int  # each segment is split into chunks to fit into kafka
			
 
				-
			
 
				-
			
 
				-class RecordingSegmentMessage(TypedDict):
			
 
				-    replay_id: str  # the uuid of the encompassing replay event
			
 
				-    org_id: int
			
 
				-    key_id: int | None
			
 
				-    received: int
			
 
				-    project_id: int
			
 
				-    replay_recording: ReplayRecordingSegment
			
--- a/src/sentry/replays/usecases/__init__.py
+++ b/src/sentry/replays/usecases/__init__.py
--- a/src/sentry/replays/usecases/ingest.py
+++ b/src/sentry/replays/usecases/ingest.py
@@ -0,0 +1,205 @@
 
				+from __future__ import annotations
			
 
				+
			
 
				+import logging
			
 
				+from datetime import datetime, timezone
			
 
				+from io import BytesIO
			
 
				+from typing import TypedDict
			
 
				+
			
 
				+import sentry_sdk
			
 
				+from django.conf import settings
			
 
				+from django.db.utils import IntegrityError
			
 
				+from sentry_sdk.tracing import Transaction
			
 
				+
			
 
				+from sentry.constants import DataCategory
			
 
				+from sentry.models import File
			
 
				+from sentry.models.project import Project
			
 
				+from sentry.replays.cache import RecordingSegmentCache, RecordingSegmentParts
			
 
				+from sentry.replays.models import ReplayRecordingSegment as ReplayRecordingSegmentModel
			
 
				+from sentry.signals import first_replay_received
			
 
				+from sentry.utils import json, metrics
			
 
				+from sentry.utils.outcomes import Outcome, track_outcome
			
 
				+
			
 
				+logger = logging.getLogger("sentry.replays")
			
 
				+
			
 
				+CACHE_TIMEOUT = 3600
			
 
				+COMMIT_FREQUENCY_SEC = 1
			
 
				+
			
 
				+
			
 
				+class ReplayRecordingSegment(TypedDict):
			
 
				+    id: str  # a uuid that individualy identifies a recording segment
			
 
				+    chunks: int  # the number of chunks for this segment
			
 
				+
			
 
				+
			
 
				+class RecordingSegmentHeaders(TypedDict):
			
 
				+    segment_id: int
			
 
				+
			
 
				+
			
 
				+class RecordingSegmentChunkMessage(TypedDict):
			
 
				+    id: str  # a uuid that individualy identifies a recording segment
			
 
				+    replay_id: str  # the uuid of the encompassing replay event
			
 
				+    project_id: int
			
 
				+    chunk_index: int  # each segment is split into chunks to fit into kafka
			
 
				+    payload: bytes
			
 
				+
			
 
				+
			
 
				+class RecordingSegmentMessage(TypedDict):
			
 
				+    replay_id: str  # the uuid of the encompassing replay event
			
 
				+    org_id: int
			
 
				+    project_id: int
			
 
				+    key_id: int | None
			
 
				+    received: int
			
 
				+    replay_recording: ReplayRecordingSegment
			
 
				+
			
 
				+
			
 
				+class MissingRecordingSegmentHeaders(ValueError):
			
 
				+    pass
			
 
				+
			
 
				+
			
 
				+@metrics.wraps("replays.usecases.ingest.ingest_chunked_recording")
			
 
				+def ingest_chunked_recording(
			
 
				+    message_dict: RecordingSegmentMessage,
			
 
				+    parts: RecordingSegmentParts,
			
 
				+    current_transaction: Transaction,
			
 
				+) -> None:
			
 
				+    with current_transaction.start_child(
			
 
				+        op="replays.process_recording.store_recording", description="store_recording"
			
 
				+    ):
			
 
				+        try:
			
 
				+            recording_segment_with_headers = collate_segment_chunks(parts)
			
 
				+        except ValueError:
			
 
				+            logger.exception("Missing recording-segment.")
			
 
				+            return None
			
 
				+
			
 
				+        try:
			
 
				+            headers, recording_segment = process_headers(recording_segment_with_headers)
			
 
				+        except MissingRecordingSegmentHeaders:
			
 
				+            logger.warning(f"missing header on {message_dict['replay_id']}")
			
 
				+            return None
			
 
				+
			
 
				+        with metrics.timer("replays.process_recording.store_recording.count_segments"):
			
 
				+            count_existing_segments = ReplayRecordingSegmentModel.objects.filter(
			
 
				+                replay_id=message_dict["replay_id"],
			
 
				+                project_id=message_dict["project_id"],
			
 
				+                segment_id=headers["segment_id"],
			
 
				+            ).count()
			
 
				+
			
 
				+        if count_existing_segments > 0:
			
 
				+            with sentry_sdk.push_scope() as scope:
			
 
				+                scope.level = "warning"
			
 
				+                scope.add_attachment(bytes=recording_segment, filename="dup_replay_segment")
			
 
				+                scope.set_tag("replay_id", message_dict["replay_id"])
			
 
				+                scope.set_tag("project_id", message_dict["project_id"])
			
 
				+
			
 
				+                logging.exception("Recording segment was already processed.")
			
 
				+
			
 
				+            parts.drop()
			
 
				+
			
 
				+            return
			
 
				+
			
 
				+        # create a File for our recording segment.
			
 
				+        recording_segment_file_name = f"rr:{message_dict['replay_id']}:{headers['segment_id']}"
			
 
				+        with metrics.timer("replays.store_recording.store_recording.create_file"):
			
 
				+            file = File.objects.create(
			
 
				+                name=recording_segment_file_name,
			
 
				+                type="replay.recording",
			
 
				+            )
			
 
				+        with metrics.timer("replays.store_recording.store_recording.put_segment_file"):
			
 
				+            file.putfile(
			
 
				+                BytesIO(recording_segment),
			
 
				+                blob_size=settings.SENTRY_ATTACHMENT_BLOB_SIZE,
			
 
				+            )
			
 
				+
			
 
				+        try:
			
 
				+            # associate this file with an indexable replay_id via ReplayRecordingSegmentModel
			
 
				+            with metrics.timer("replays.store_recording.store_recording.create_segment_row"):
			
 
				+                ReplayRecordingSegmentModel.objects.create(
			
 
				+                    replay_id=message_dict["replay_id"],
			
 
				+                    project_id=message_dict["project_id"],
			
 
				+                    segment_id=headers["segment_id"],
			
 
				+                    file_id=file.id,
			
 
				+                    size=len(recording_segment),
			
 
				+                )
			
 
				+        except IntegrityError:
			
 
				+            # Same message was encountered more than once.
			
 
				+            logger.warning(
			
 
				+                "Recording-segment has already been processed.",
			
 
				+                extra={
			
 
				+                    "replay_id": message_dict["replay_id"],
			
 
				+                    "project_id": message_dict["project_id"],
			
 
				+                    "segment_id": headers["segment_id"],
			
 
				+                },
			
 
				+            )
			
 
				+
			
 
				+            # Cleanup the blob.
			
 
				+            file.delete()
			
 
				+
			
 
				+        # delete the recording segment from cache after we've stored it
			
 
				+        with metrics.timer("replays.process_recording.store_recording.drop_segments"):
			
 
				+            parts.drop()
			
 
				+
			
 
				+        # TODO: how to handle failures in the above calls. what should happen?
			
 
				+        # also: handling same message twice?
			
 
				+
			
 
				+        # TODO: in join wait for outcomes producer to flush possibly,
			
 
				+        # or do this in a separate arroyo step
			
 
				+        # also need to talk with other teams on only-once produce requirements
			
 
				+        if headers["segment_id"] == 0 and message_dict.get("org_id"):
			
 
				+            project = Project.objects.get_from_cache(id=message_dict["project_id"])
			
 
				+            if not project.flags.has_replays:
			
 
				+                first_replay_received.send_robust(project=project, sender=Project)
			
 
				+
			
 
				+            track_outcome(
			
 
				+                org_id=message_dict["org_id"],
			
 
				+                project_id=message_dict["project_id"],
			
 
				+                key_id=message_dict.get("key_id"),
			
 
				+                outcome=Outcome.ACCEPTED,
			
 
				+                reason=None,
			
 
				+                timestamp=datetime.utcfromtimestamp(message_dict["received"]).replace(
			
 
				+                    tzinfo=timezone.utc
			
 
				+                ),
			
 
				+                event_id=message_dict["replay_id"],
			
 
				+                category=DataCategory.REPLAY,
			
 
				+                quantity=1,
			
 
				+            )
			
 
				+
			
 
				+    current_transaction.finish()
			
 
				+
			
 
				+
			
 
				+@metrics.wraps("replays.usecases.ingest.ingest_chunk")
			
 
				+def ingest_chunk(
			
 
				+    message_dict: RecordingSegmentChunkMessage, current_transaction: Transaction
			
 
				+) -> None:
			
 
				+    """Ingest chunked message part."""
			
 
				+    with current_transaction.start_child(op="replays.process_recording.store_chunk"):
			
 
				+        cache_prefix = replay_recording_segment_cache_id(
			
 
				+            project_id=message_dict["project_id"],
			
 
				+            replay_id=message_dict["replay_id"],
			
 
				+            segment_id=message_dict["id"],
			
 
				+        )
			
 
				+
			
 
				+        part = RecordingSegmentCache(cache_prefix)
			
 
				+        part[message_dict["chunk_index"]] = message_dict["payload"]
			
 
				+
			
 
				+    current_transaction.finish()
			
 
				+
			
 
				+
			
 
				+@metrics.wraps("replays.usecases.ingest.collate_segment_chunks")
			
 
				+def collate_segment_chunks(chunks: RecordingSegmentParts) -> bytes:
			
 
				+    """Collect and merge recording segment chunks."""
			
 
				+    # The chunks were gzipped by the SDK and disassembled by Relay. In this step we can
			
 
				+    # blindly merge the bytes objects into a single bytes object.
			
 
				+    return b"".join(list(chunks))
			
 
				+
			
 
				+
			
 
				+@metrics.wraps("replays.usecases.ingest.process_headers")
			
 
				+def process_headers(bytes_with_headers: bytes) -> tuple[RecordingSegmentHeaders, bytes]:
			
 
				+    try:
			
 
				+        recording_headers, recording_segment = bytes_with_headers.split(b"\n", 1)
			
 
				+    except ValueError:
			
 
				+        raise MissingRecordingSegmentHeaders
			
 
				+    else:
			
 
				+        return json.loads(recording_headers), recording_segment
			
 
				+
			
 
				+
			
 
				+def replay_recording_segment_cache_id(project_id: int, replay_id: str, segment_id: str) -> str:
			
 
				+    return f"{project_id}:{replay_id}:{segment_id}"