2 years ago · 79ac246211
--- a/src/sentry/replays/consumers/recording/process_recording.py
+++ b/src/sentry/replays/consumers/recording/process_recording.py
@@ -6,8 +6,6 @@ import random
 
															 import time
														
 
															 from collections import deque
														
 
															 from concurrent.futures import Future
														
 
															-from datetime import datetime, timezone
														
 
															-from io import BytesIO
														
 
															 from typing import Callable, Deque, Mapping, MutableMapping, NamedTuple, Optional, cast
														
 
															 import msgpack
														
@@ -17,22 +15,16 @@ from arroyo.backends.kafka.consumer import KafkaPayload
 
															 from arroyo.processing.strategies.abstract import ProcessingStrategy
														
 
															 from arroyo.types import Message, Position
														
 
															 from django.conf import settings
														
 
															-from django.db.utils import IntegrityError
														
 
															 from sentry_sdk.tracing import Transaction
														
 
															-from sentry.constants import DataCategory
														
 
															-from sentry.models import File
														
 
															-from sentry.models.project import Project
														
 
															-from sentry.replays.cache import RecordingSegmentCache, RecordingSegmentParts
														
 
															-from sentry.replays.consumers.recording.types import (
														
 
															+from sentry.replays.cache import RecordingSegmentParts
														
 
															+from sentry.replays.usecases.ingest import (
														
 
															     RecordingSegmentChunkMessage,
														
 
															-    RecordingSegmentHeaders,
														
 
															     RecordingSegmentMessage,
														
 
															+    ingest_chunk,
														
 
															+    ingest_chunked_recording,
														
 
															 )
														
 
															-from sentry.replays.models import ReplayRecordingSegment
														
 
															-from sentry.signals import first_replay_received
														
 
															-from sentry.utils import json, metrics
														
 
															-from sentry.utils.outcomes import Outcome, track_outcome
														
 
															+from sentry.utils import metrics
														
 
															 logger = logging.getLogger("sentry.replays")
														
@@ -67,151 +59,13 @@ class ProcessRecordingSegmentStrategy(ProcessingStrategy[KafkaPayload]):
 
															         self.__commit_data: MutableMapping[Partition, Position] = {}
														
 
															         self.__last_committed: float = 0
														
 
															-    @metrics.wraps("replays.process_recording.process_chunk")
														
 
															-    def _process_chunk(
														
 
															-        self,
														
 
															-        message_dict: RecordingSegmentChunkMessage,
														
 
															-        message: Message[KafkaPayload],
														
 
															-        current_transaction: Transaction,
														
 
															-    ) -> None:
														
 
															-        cache_prefix = replay_recording_segment_cache_id(
														
 
															-            project_id=message_dict["project_id"],
														
 
															-            replay_id=message_dict["replay_id"],
														
 
															-            segment_id=message_dict["id"],
														
 
															-        )
														
 
															-
														
 
															-        part = RecordingSegmentCache(cache_prefix)
														
 
															-        with current_transaction.start_child(op="replays.process_recording.store_chunk"):
														
 
															-            part[message_dict["chunk_index"]] = message_dict["payload"]
														
 
															-        current_transaction.finish()
														
 
															-
														
 
															-    @metrics.wraps("replays.process_recording.store_recording.process_headers")
														
 
															-    def _process_headers(
														
 
															-        self, recording_segment_with_headers: bytes
														
 
															-    ) -> tuple[RecordingSegmentHeaders, bytes]:
														
 
															-        # split the recording payload by a newline into the headers and the recording
														
 
															-        try:
														
 
															-            recording_headers, recording_segment = recording_segment_with_headers.split(b"\n", 1)
														
 
															-        except ValueError:
														
 
															-            raise MissingRecordingSegmentHeaders
														
 
															-        return json.loads(recording_headers), recording_segment
														
 
															-
														
 
															-    @metrics.wraps("replays.process_recording.store_recording")
														
 
															     def _store(
														
 
															         self,
														
 
															         message_dict: RecordingSegmentMessage,
														
 
															         parts: RecordingSegmentParts,
														
 
															         current_transaction: Transaction,
														
 
															     ) -> None:
														
 
															-        with current_transaction.start_child(
														
 
															-            op="replays.process_recording.store_recording", description="store_recording"
														
 
															-        ):
														
 
															-            with metrics.timer("replays.process_recording.store_recording.read_segments"):
														
 
															-                try:
														
 
															-                    recording_segment_parts = list(parts)
														
 
															-                except ValueError:
														
 
															-                    logger.exception("Missing recording-segment.")
														
 
															-                    return None
														
 
															-
														
 
															-            try:
														
 
															-                headers, parsed_first_part = self._process_headers(recording_segment_parts[0])
														
 
															-            except MissingRecordingSegmentHeaders:
														
 
															-                logger.warning(f"missing header on {message_dict['replay_id']}")
														
 
															-                return
														
 
															-
														
 
															-            # Replace the first part with itself but the headers removed.
														
 
															-            recording_segment_parts[0] = parsed_first_part
														
 
															-
														
 
															-            # The parts were gzipped by the SDK and disassembled by Relay. In this step we can
														
 
															-            # blindly merge the bytes objects into a single bytes object.
														
 
															-            recording_segment = b"".join(recording_segment_parts)
														
 
															-
														
 
															-            with metrics.timer("replays.process_recording.store_recording.count_segments"):
														
 
															-                count_existing_segments = ReplayRecordingSegment.objects.filter(
														
 
															-                    replay_id=message_dict["replay_id"],
														
 
															-                    project_id=message_dict["project_id"],
														
 
															-                    segment_id=headers["segment_id"],
														
 
															-                ).count()
														
 
															-
														
 
															-            if count_existing_segments > 0:
														
 
															-                with sentry_sdk.push_scope() as scope:
														
 
															-                    scope.level = "warning"
														
 
															-                    scope.add_attachment(bytes=recording_segment, filename="dup_replay_segment")
														
 
															-                    scope.set_tag("replay_id", message_dict["replay_id"])
														
 
															-                    scope.set_tag("project_id", message_dict["project_id"])
														
 
															-
														
 
															-                    logging.exception("Recording segment was already processed.")
														
 
															-
														
 
															-                parts.drop()
														
 
															-
														
 
															-                return
														
 
															-
														
 
															-            # create a File for our recording segment.
														
 
															-            recording_segment_file_name = f"rr:{message_dict['replay_id']}:{headers['segment_id']}"
														
 
															-            with metrics.timer("replays.store_recording.store_recording.create_file"):
														
 
															-                file = File.objects.create(
														
 
															-                    name=recording_segment_file_name,
														
 
															-                    type="replay.recording",
														
 
															-                )
														
 
															-            with metrics.timer("replays.store_recording.store_recording.put_segment_file"):
														
 
															-                file.putfile(
														
 
															-                    BytesIO(recording_segment),
														
 
															-                    blob_size=settings.SENTRY_ATTACHMENT_BLOB_SIZE,
														
 
															-                )
														
 
															-
														
 
															-            try:
														
 
															-                # associate this file with an indexable replay_id via ReplayRecordingSegment
														
 
															-                with metrics.timer("replays.store_recording.store_recording.create_segment_row"):
														
 
															-                    ReplayRecordingSegment.objects.create(
														
 
															-                        replay_id=message_dict["replay_id"],
														
 
															-                        project_id=message_dict["project_id"],
														
 
															-                        segment_id=headers["segment_id"],
														
 
															-                        file_id=file.id,
														
 
															-                        size=len(recording_segment),
														
 
															-                    )
														
 
															-            except IntegrityError:
														
 
															-                # Same message was encountered more than once.
														
 
															-                logger.warning(
														
 
															-                    "Recording-segment has already been processed.",
														
 
															-                    extra={
														
 
															-                        "replay_id": message_dict["replay_id"],
														
 
															-                        "project_id": message_dict["project_id"],
														
 
															-                        "segment_id": headers["segment_id"],
														
 
															-                    },
														
 
															-                )
														
 
															-
														
 
															-                # Cleanup the blob.
														
 
															-                file.delete()
														
 
															-
														
 
															-            # delete the recording segment from cache after we've stored it
														
 
															-            with metrics.timer("replays.process_recording.store_recording.drop_segments"):
														
 
															-                parts.drop()
														
 
															-
														
 
															-            # TODO: how to handle failures in the above calls. what should happen?
														
 
															-            # also: handling same message twice?
														
 
															-
														
 
															-            # TODO: in join wait for outcomes producer to flush possibly,
														
 
															-            # or do this in a separate arroyo step
														
 
															-            # also need to talk with other teams on only-once produce requirements
														
 
															-            if headers["segment_id"] == 0 and message_dict.get("org_id"):
														
 
															-                project = Project.objects.get_from_cache(id=message_dict["project_id"])
														
 
															-                if not project.flags.has_replays:
														
 
															-                    first_replay_received.send_robust(project=project, sender=Project)
														
 
															-
														
 
															-                track_outcome(
														
 
															-                    org_id=message_dict["org_id"],
														
 
															-                    project_id=message_dict["project_id"],
														
 
															-                    key_id=message_dict.get("key_id"),
														
 
															-                    outcome=Outcome.ACCEPTED,
														
 
															-                    reason=None,
														
 
															-                    timestamp=datetime.utcfromtimestamp(message_dict["received"]).replace(
														
 
															-                        tzinfo=timezone.utc
														
 
															-                    ),
														
 
															-                    event_id=message_dict["replay_id"],
														
 
															-                    category=DataCategory.REPLAY,
														
 
															-                    quantity=1,
														
 
															-                )
														
 
															-        current_transaction.finish()
														
 
															+        ingest_chunked_recording(message_dict, parts, current_transaction)
														
 
															     def _process_recording(
														
 
															         self,
														
@@ -219,7 +73,6 @@ class ProcessRecordingSegmentStrategy(ProcessingStrategy[KafkaPayload]):
 
															         message: Message[KafkaPayload],
														
 
															         current_transaction: Transaction,
														
 
															     ) -> None:
														
 
															-
														
 
															         cache_prefix = replay_recording_segment_cache_id(
														
 
															             project_id=message_dict["project_id"],
														
 
															             replay_id=message_dict["replay_id"],
														
@@ -264,12 +117,12 @@ class ProcessRecordingSegmentStrategy(ProcessingStrategy[KafkaPayload]):
 
															                     # as msgpack will decode it as a utf-8 python string
														
 
															                     message_dict["payload"] = message_dict["payload"].encode("utf-8")
														
 
															-                self._process_chunk(
														
 
															-                    cast(RecordingSegmentChunkMessage, message_dict), message, current_transaction
														
 
															-                )
														
 
															-            if message_dict["type"] == "replay_recording":
														
 
															+                ingest_chunk(cast(RecordingSegmentChunkMessage, message_dict), current_transaction)
														
 
															+            elif message_dict["type"] == "replay_recording":
														
 
															                 self._process_recording(
														
 
															-                    cast(RecordingSegmentMessage, message_dict), message, current_transaction
														
 
															+                    cast(RecordingSegmentMessage, message_dict),
														
 
															+                    message,
														
 
															+                    current_transaction,
														
 
															                 )
														
 
															         except Exception:
														
 
															             # avoid crash looping on bad messsages for now
														
--- a/src/sentry/replays/consumers/recording/types.py
+++ b/src/sentry/replays/consumers/recording/types.py
@@ -1,29 +0,0 @@
 
															-from __future__ import annotations
														
 
															-
														
 
															-from typing import TypedDict
														
 
															-
														
 
															-
														
 
															-class ReplayRecordingSegment(TypedDict):
														
 
															-    chunks: int  # the number of chunks for this segment
														
 
															-    id: str  # a uuid that individualy identifies a recording segment
														
 
															-
														
 
															-
														
 
															-class RecordingSegmentHeaders(TypedDict):
														
 
															-    segment_id: int
														
 
															-
														
 
															-
														
 
															-class RecordingSegmentChunkMessage(TypedDict):
														
 
															-    payload: bytes
														
 
															-    replay_id: str  # the uuid of the encompassing replay event
														
 
															-    id: str  # a uuid that individualy identifies a recording segment
														
 
															-    project_id: int
														
 
															-    chunk_index: int  # each segment is split into chunks to fit into kafka
														
 
															-
														
 
															-
														
 
															-class RecordingSegmentMessage(TypedDict):
														
 
															-    replay_id: str  # the uuid of the encompassing replay event
														
 
															-    org_id: int
														
 
															-    key_id: int | None
														
 
															-    received: int
														
 
															-    project_id: int
														
 
															-    replay_recording: ReplayRecordingSegment
														
--- a/src/sentry/replays/usecases/__init__.py
+++ b/src/sentry/replays/usecases/__init__.py
--- a/src/sentry/replays/usecases/ingest.py
+++ b/src/sentry/replays/usecases/ingest.py
@@ -0,0 +1,205 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+import logging
														
 
															+from datetime import datetime, timezone
														
 
															+from io import BytesIO
														
 
															+from typing import TypedDict
														
 
															+
														
 
															+import sentry_sdk
														
 
															+from django.conf import settings
														
 
															+from django.db.utils import IntegrityError
														
 
															+from sentry_sdk.tracing import Transaction
														
 
															+
														
 
															+from sentry.constants import DataCategory
														
 
															+from sentry.models import File
														
 
															+from sentry.models.project import Project
														
 
															+from sentry.replays.cache import RecordingSegmentCache, RecordingSegmentParts
														
 
															+from sentry.replays.models import ReplayRecordingSegment as ReplayRecordingSegmentModel
														
 
															+from sentry.signals import first_replay_received
														
 
															+from sentry.utils import json, metrics
														
 
															+from sentry.utils.outcomes import Outcome, track_outcome
														
 
															+
														
 
															+logger = logging.getLogger("sentry.replays")
														
 
															+
														
 
															+CACHE_TIMEOUT = 3600
														
 
															+COMMIT_FREQUENCY_SEC = 1
														
 
															+
														
 
															+
														
 
															+class ReplayRecordingSegment(TypedDict):
														
 
															+    id: str  # a uuid that individualy identifies a recording segment
														
 
															+    chunks: int  # the number of chunks for this segment
														
 
															+
														
 
															+
														
 
															+class RecordingSegmentHeaders(TypedDict):
														
 
															+    segment_id: int
														
 
															+
														
 
															+
														
 
															+class RecordingSegmentChunkMessage(TypedDict):
														
 
															+    id: str  # a uuid that individualy identifies a recording segment
														
 
															+    replay_id: str  # the uuid of the encompassing replay event
														
 
															+    project_id: int
														
 
															+    chunk_index: int  # each segment is split into chunks to fit into kafka
														
 
															+    payload: bytes
														
 
															+
														
 
															+
														
 
															+class RecordingSegmentMessage(TypedDict):
														
 
															+    replay_id: str  # the uuid of the encompassing replay event
														
 
															+    org_id: int
														
 
															+    project_id: int
														
 
															+    key_id: int | None
														
 
															+    received: int
														
 
															+    replay_recording: ReplayRecordingSegment
														
 
															+
														
 
															+
														
 
															+class MissingRecordingSegmentHeaders(ValueError):
														
 
															+    pass
														
 
															+
														
 
															+
														
 
															+@metrics.wraps("replays.usecases.ingest.ingest_chunked_recording")
														
 
															+def ingest_chunked_recording(
														
 
															+    message_dict: RecordingSegmentMessage,
														
 
															+    parts: RecordingSegmentParts,
														
 
															+    current_transaction: Transaction,
														
 
															+) -> None:
														
 
															+    with current_transaction.start_child(
														
 
															+        op="replays.process_recording.store_recording", description="store_recording"
														
 
															+    ):
														
 
															+        try:
														
 
															+            recording_segment_with_headers = collate_segment_chunks(parts)
														
 
															+        except ValueError:
														
 
															+            logger.exception("Missing recording-segment.")
														
 
															+            return None
														
 
															+
														
 
															+        try:
														
 
															+            headers, recording_segment = process_headers(recording_segment_with_headers)
														
 
															+        except MissingRecordingSegmentHeaders:
														
 
															+            logger.warning(f"missing header on {message_dict['replay_id']}")
														
 
															+            return None
														
 
															+
														
 
															+        with metrics.timer("replays.process_recording.store_recording.count_segments"):
														
 
															+            count_existing_segments = ReplayRecordingSegmentModel.objects.filter(
														
 
															+                replay_id=message_dict["replay_id"],
														
 
															+                project_id=message_dict["project_id"],
														
 
															+                segment_id=headers["segment_id"],
														
 
															+            ).count()
														
 
															+
														
 
															+        if count_existing_segments > 0:
														
 
															+            with sentry_sdk.push_scope() as scope:
														
 
															+                scope.level = "warning"
														
 
															+                scope.add_attachment(bytes=recording_segment, filename="dup_replay_segment")
														
 
															+                scope.set_tag("replay_id", message_dict["replay_id"])
														
 
															+                scope.set_tag("project_id", message_dict["project_id"])
														
 
															+
														
 
															+                logging.exception("Recording segment was already processed.")
														
 
															+
														
 
															+            parts.drop()
														
 
															+
														
 
															+            return
														
 
															+
														
 
															+        # create a File for our recording segment.
														
 
															+        recording_segment_file_name = f"rr:{message_dict['replay_id']}:{headers['segment_id']}"
														
 
															+        with metrics.timer("replays.store_recording.store_recording.create_file"):
														
 
															+            file = File.objects.create(
														
 
															+                name=recording_segment_file_name,
														
 
															+                type="replay.recording",
														
 
															+            )
														
 
															+        with metrics.timer("replays.store_recording.store_recording.put_segment_file"):
														
 
															+            file.putfile(
														
 
															+                BytesIO(recording_segment),
														
 
															+                blob_size=settings.SENTRY_ATTACHMENT_BLOB_SIZE,
														
 
															+            )
														
 
															+
														
 
															+        try:
														
 
															+            # associate this file with an indexable replay_id via ReplayRecordingSegmentModel
														
 
															+            with metrics.timer("replays.store_recording.store_recording.create_segment_row"):
														
 
															+                ReplayRecordingSegmentModel.objects.create(
														
 
															+                    replay_id=message_dict["replay_id"],
														
 
															+                    project_id=message_dict["project_id"],
														
 
															+                    segment_id=headers["segment_id"],
														
 
															+                    file_id=file.id,
														
 
															+                    size=len(recording_segment),
														
 
															+                )
														
 
															+        except IntegrityError:
														
 
															+            # Same message was encountered more than once.
														
 
															+            logger.warning(
														
 
															+                "Recording-segment has already been processed.",
														
 
															+                extra={
														
 
															+                    "replay_id": message_dict["replay_id"],
														
 
															+                    "project_id": message_dict["project_id"],
														
 
															+                    "segment_id": headers["segment_id"],
														
 
															+                },
														
 
															+            )
														
 
															+
														
 
															+            # Cleanup the blob.
														
 
															+            file.delete()
														
 
															+
														
 
															+        # delete the recording segment from cache after we've stored it
														
 
															+        with metrics.timer("replays.process_recording.store_recording.drop_segments"):
														
 
															+            parts.drop()
														
 
															+
														
 
															+        # TODO: how to handle failures in the above calls. what should happen?
														
 
															+        # also: handling same message twice?
														
 
															+
														
 
															+        # TODO: in join wait for outcomes producer to flush possibly,
														
 
															+        # or do this in a separate arroyo step
														
 
															+        # also need to talk with other teams on only-once produce requirements
														
 
															+        if headers["segment_id"] == 0 and message_dict.get("org_id"):
														
 
															+            project = Project.objects.get_from_cache(id=message_dict["project_id"])
														
 
															+            if not project.flags.has_replays:
														
 
															+                first_replay_received.send_robust(project=project, sender=Project)
														
 
															+
														
 
															+            track_outcome(
														
 
															+                org_id=message_dict["org_id"],
														
 
															+                project_id=message_dict["project_id"],
														
 
															+                key_id=message_dict.get("key_id"),
														
 
															+                outcome=Outcome.ACCEPTED,
														
 
															+                reason=None,
														
 
															+                timestamp=datetime.utcfromtimestamp(message_dict["received"]).replace(
														
 
															+                    tzinfo=timezone.utc
														
 
															+                ),
														
 
															+                event_id=message_dict["replay_id"],
														
 
															+                category=DataCategory.REPLAY,
														
 
															+                quantity=1,
														
 
															+            )
														
 
															+
														
 
															+    current_transaction.finish()
														
 
															+
														
 
															+
														
 
															+@metrics.wraps("replays.usecases.ingest.ingest_chunk")
														
 
															+def ingest_chunk(
														
 
															+    message_dict: RecordingSegmentChunkMessage, current_transaction: Transaction
														
 
															+) -> None:
														
 
															+    """Ingest chunked message part."""
														
 
															+    with current_transaction.start_child(op="replays.process_recording.store_chunk"):
														
 
															+        cache_prefix = replay_recording_segment_cache_id(
														
 
															+            project_id=message_dict["project_id"],
														
 
															+            replay_id=message_dict["replay_id"],
														
 
															+            segment_id=message_dict["id"],
														
 
															+        )
														
 
															+
														
 
															+        part = RecordingSegmentCache(cache_prefix)
														
 
															+        part[message_dict["chunk_index"]] = message_dict["payload"]
														
 
															+
														
 
															+    current_transaction.finish()
														
 
															+
														
 
															+
														
 
															+@metrics.wraps("replays.usecases.ingest.collate_segment_chunks")
														
 
															+def collate_segment_chunks(chunks: RecordingSegmentParts) -> bytes:
														
 
															+    """Collect and merge recording segment chunks."""
														
 
															+    # The chunks were gzipped by the SDK and disassembled by Relay. In this step we can
														
 
															+    # blindly merge the bytes objects into a single bytes object.
														
 
															+    return b"".join(list(chunks))
														
 
															+
														
 
															+
														
 
															+@metrics.wraps("replays.usecases.ingest.process_headers")
														
 
															+def process_headers(bytes_with_headers: bytes) -> tuple[RecordingSegmentHeaders, bytes]:
														
 
															+    try:
														
 
															+        recording_headers, recording_segment = bytes_with_headers.split(b"\n", 1)
														
 
															+    except ValueError:
														
 
															+        raise MissingRecordingSegmentHeaders
														
 
															+    else:
														
 
															+        return json.loads(recording_headers), recording_segment
														
 
															+
														
 
															+
														
 
															+def replay_recording_segment_cache_id(project_id: int, replay_id: str, segment_id: str) -> str:
														
 
															+    return f"{project_id}:{replay_id}:{segment_id}"