SMusatov
/
sentry
зеркало из https://github.com/getsentry/sentry


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607
							from datetime import datetime, timedelta, timezone

import pytest
from snuba_sdk.aliased_expression import AliasedExpression
from snuba_sdk.column import Column
from snuba_sdk.conditions import Condition, Op, Or
from snuba_sdk.function import Function
from snuba_sdk.orderby import Direction, OrderBy

from sentry.exceptions import InvalidSearchQuery
from sentry.search.events.builder import ProfilesQueryBuilder, ProfilesTimeseriesQueryBuilder
from sentry.search.events.datasets.profiles import COLUMNS as PROFILE_COLUMNS
from sentry.search.events.datasets.profiles import ProfilesDatasetConfig
from sentry.snuba.dataset import Dataset
from sentry.testutils.factories import Factories
from sentry.testutils.pytest.fixtures import django_db_all

# pin a timestamp for now so tests results dont change
now = datetime(2022, 10, 31, 0, 0, tzinfo=timezone.utc)
today = now.replace(hour=0, minute=0, second=0, microsecond=0)


@pytest.fixture
def params():
    organization = Factories.create_organization()
    team = Factories.create_team(organization=organization)
    project1 = Factories.create_project(organization=organization, teams=[team])
    project2 = Factories.create_project(organization=organization, teams=[team])

    user = Factories.create_user()
    Factories.create_team_membership(team=team, user=user)

    return {
        "start": now - timedelta(days=7),
        "end": now - timedelta(seconds=1),
        "project_id": [project1.id, project2.id],
        "project_objects": [project1, project2],
        "organization_id": organization.id,
        "user_id": user.id,
        "team_id": [team.id],
    }


def query_builder_fns(arg_name="query_builder_fn"):
    return pytest.mark.parametrize(
        arg_name,
        [
            pytest.param(ProfilesQueryBuilder, id="ProfilesQueryBuilder"),
            pytest.param(
                lambda **kwargs: ProfilesTimeseriesQueryBuilder(interval=60, **kwargs),
                id="ProfilesTimeseriesQueryBuilder",
            ),
        ],
    )


@pytest.mark.parametrize(
    "field,resolved",
    [pytest.param(column.alias, column.column, id=column.alias) for column in PROFILE_COLUMNS],
)
@query_builder_fns()
@django_db_all
def test_field_resolution(query_builder_fn, params, field, resolved):
    builder = query_builder_fn(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=[field],
    )
    if field == resolved:
        assert builder.columns == [Column(field)]
    else:
        assert builder.columns == [AliasedExpression(Column(resolved), alias=field)]


@pytest.mark.parametrize(
    "field,resolved",
    [
        pytest.param(
            "last_seen()",
            Function("max", parameters=[Column("received")], alias="last_seen"),
            id="last_seen()",
        ),
        pytest.param(
            "latest_event()",
            Function(
                "argMax",
                parameters=[Column("profile_id"), Column("received")],
                alias="latest_event",
            ),
            id="latest_event()",
        ),
        pytest.param("count()", Function("count", parameters=[], alias="count"), id="count()"),
        pytest.param(
            "count_unique(transaction)",
            Function(
                "uniq", parameters=[Column("transaction_name")], alias="count_unique_transaction"
            ),
            id="count_unique(transaction)",
        ),
        pytest.param(
            "percentile(profile.duration,0.25)",
            Function(
                "quantile(0.25)",
                parameters=[Column("duration_ns")],
                alias="percentile_profile_duration_0_25",
            ),
            id="percentile(profile.duration,0.25)",
        ),
        *[
            pytest.param(
                f"p{qt}()",
                Function(
                    f"quantile(0.{qt.rstrip('0')})",
                    parameters=[Column("duration_ns")],
                    alias=f"p{qt}",
                ),
                id=f"p{qt}()",
            )
            for qt in ["50", "75", "95", "99"]
        ],
        pytest.param(
            "p100()",
            Function(
                "max",
                parameters=[Column("duration_ns")],
                alias="p100",
            ),
            id="p100()",
        ),
        *[
            pytest.param(
                f"p{qt}(profile.duration)",
                Function(
                    f"quantile(0.{qt.rstrip('0')})",
                    parameters=[Column("duration_ns")],
                    alias=f"p{qt}_profile_duration",
                ),
                id=f"p{qt}(profile.duration)",
            )
            for qt in ["50", "75", "95", "99"]
        ],
        pytest.param(
            "p100(profile.duration)",
            Function(
                "max",
                parameters=[Column("duration_ns")],
                alias="p100_profile_duration",
            ),
            id="p100(profile.duration)",
        ),
        *[
            pytest.param(
                f"{fn}(profile.duration)",
                Function(
                    fn,
                    parameters=[Column("duration_ns")],
                    alias=f"{fn}_profile_duration",
                ),
                id=f"{fn}(profile.duration)",
            )
            for fn in ["min", "max", "avg", "sum"]
        ],
    ],
)
@query_builder_fns()
@django_db_all
def test_aggregate_resolution(query_builder_fn, params, field, resolved):
    builder = query_builder_fn(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=[field],
    )
    assert builder.columns == [resolved]


@pytest.mark.parametrize(
    "field,message",
    [
        pytest.param("foo", "Unknown field: foo", id="foo"),
        pytest.param("count(id)", "count: expected 0 argument\\(s\\)", id="count(id)"),
        pytest.param(
            "count_unique(foo)",
            "count_unique: column argument invalid: foo is not a valid column",
            id="count_unique(foo)",
        ),
        *[
            pytest.param(
                f"p{qt}(foo)",
                f"p{qt}: column argument invalid: foo is not a valid column",
                id=f"p{qt}(foo)",
            )
            for qt in ["50", "75", "95", "99"]
        ],
        *[
            pytest.param(
                f"p{qt}(id)",
                f"p{qt}: column argument invalid: id is not a numeric column",
                id=f"p{qt}(id)",
            )
            for qt in ["50", "75", "95", "99"]
        ],
        pytest.param(
            "percentile(foo,0.25)",
            "percentile: column argument invalid: foo is not a valid column",
            id="percentile(foo,0.25)",
        ),
        pytest.param(
            "percentile(id,0.25)",
            "percentile: column argument invalid: id is not a numeric column",
            id="percentile(id,0.25)",
        ),
        *[
            pytest.param(
                f"{fn}(foo)",
                f"{fn}: column argument invalid: foo is not a valid column",
                id=f"{fn}(foo)",
            )
            for fn in ["min", "max", "avg", "sum"]
        ],
        *[
            pytest.param(
                f"{fn}(id)",
                f"{fn}: column argument invalid: id is not a numeric column",
                id=f"{fn}(id)",
            )
            for fn in ["min", "max", "avg", "sum"]
        ],
    ],
)
@query_builder_fns()
@django_db_all
def test_invalid_field_resolution(query_builder_fn, params, field, message):
    with pytest.raises(InvalidSearchQuery, match=message):
        query_builder_fn(
            dataset=Dataset.Profiles,
            params=params,
            selected_columns=[field],
        )


def is_null(column: str) -> Function:
    return Function("isNull", parameters=[Column(column)])


@pytest.mark.parametrize(
    "query,conditions",
    [
        pytest.param(
            "project.id:1", [Condition(Column("project_id"), Op.EQ, 1.0)], id="project.id:1"
        ),
        pytest.param(
            "!project.id:1",
            [Condition(Column("project_id"), Op.NEQ, 1.0)],
            id="!project.id:1",
        ),
        pytest.param(
            f"trace.transaction:{'a' * 32}",
            [Condition(Column("transaction_id"), Op.EQ, "a" * 32)],
            id=f"trace.transaction:{'a' * 32}",
        ),
        pytest.param(
            f"!trace.transaction:{'a' * 32}",
            [Condition(Column("transaction_id"), Op.NEQ, "a" * 32)],
            id=f"!trace.transaction:{'a' * 32}",
        ),
        pytest.param(
            f"id:{'a' * 32}",
            [Condition(Column("profile_id"), Op.EQ, "a" * 32)],
            id=f"id:{'a' * 32}",
        ),
        pytest.param(
            f"!id:{'a' * 32}",
            [Condition(Column("profile_id"), Op.NEQ, "a" * 32)],
            id=f"!id:{'a' * 32}",
        ),
        pytest.param(
            f"timestamp:{today.isoformat()}",
            [
                # filtering for a timestamp means we search for a window around it
                Condition(Column("received"), Op.GTE, today - timedelta(minutes=5)),
                Condition(Column("received"), Op.LT, today + timedelta(minutes=6)),
            ],
            id=f"timestamp:{today.isoformat()}",
        ),
        pytest.param(
            f"!timestamp:{today.isoformat()}",
            [],  # not sure what this should be yet
            id=f"!timestamp:{today.isoformat()}",
            marks=pytest.mark.xfail(reason="date filters cannot negated"),
        ),
        pytest.param(
            "device.arch:x86_64",
            [Condition(Column("architecture"), Op.EQ, "x86_64")],
            id="device.arch:x86_64",
        ),
        pytest.param(
            "!device.arch:x86_64",
            [Condition(Column("architecture"), Op.NEQ, "x86_64")],
            id="!device.arch:x86_64",
        ),
        pytest.param(
            "device.classification:high",
            [Condition(Column("device_classification"), Op.EQ, "high")],
            id="device.classification:high",
        ),
        pytest.param(
            "!device.classification:high",
            [Condition(Column("device_classification"), Op.NEQ, "high")],
            id="!device.classification:high",
        ),
        pytest.param(
            "device.locale:en_US",
            [Condition(Column("device_locale"), Op.EQ, "en_US")],
            id="device.locale:en_US",
        ),
        pytest.param(
            "!device.locale:en_US",
            [Condition(Column("device_locale"), Op.NEQ, "en_US")],
            id="!device.locale:en_US",
        ),
        pytest.param(
            "device.manufacturer:Apple",
            [Condition(Column("device_manufacturer"), Op.EQ, "Apple")],
            id="device.manufacturer:Apple",
        ),
        pytest.param(
            "!device.manufacturer:Apple",
            [Condition(Column("device_manufacturer"), Op.NEQ, "Apple")],
            id="!device.manufacturer:Apple",
        ),
        pytest.param(
            "device.model:iPhone14,2",
            [Condition(Column("device_model"), Op.EQ, "iPhone14,2")],
            id="device.model:iPhone14,2",
        ),
        pytest.param(
            "!device.model:iPhone14,2",
            [Condition(Column("device_model"), Op.NEQ, "iPhone14,2")],
            id="!device.model:iPhone14,2",
        ),
        pytest.param(
            "device.model:iPhone14,2",
            [Condition(Column("device_model"), Op.EQ, "iPhone14,2")],
            id="device.model:iPhone14,2",
        ),
        pytest.param(
            "os.build:20G817",
            [Condition(Column("device_os_build_number"), Op.EQ, "20G817")],
            id="os.build:20G817",
        ),
        pytest.param(
            "!os.build:20G817",
            [
                # os.build is a nullable column
                Or(
                    conditions=[
                        Condition(is_null("device_os_build_number"), Op.EQ, 1),
                        Condition(Column("device_os_build_number"), Op.NEQ, "20G817"),
                    ]
                )
            ],
            id="!os.build:20G817",
        ),
        pytest.param(
            "os.name:iOS",
            [Condition(Column("device_os_name"), Op.EQ, "iOS")],
            id="os.name:iOS",
        ),
        pytest.param(
            "!os.name:iOS",
            [Condition(Column("device_os_name"), Op.NEQ, "iOS")],
            id="!os.name:iOS",
        ),
        pytest.param(
            "os.version:15.2",
            [Condition(Column("device_os_version"), Op.EQ, "15.2")],
            id="os.version:15.2",
        ),
        pytest.param(
            "!os.version:15.2",
            [Condition(Column("device_os_version"), Op.NEQ, "15.2")],
            id="!os.version:15.2",
        ),
        pytest.param(
            "profile.duration:1",
            # since 1 mean 1 millisecond, and converted to nanoseconds its 1e6
            [Condition(Column("duration_ns"), Op.EQ, 1e6)],
            id="profile.duration:1",
        ),
        pytest.param(
            "!profile.duration:1",
            # since 1 mean 1 millisecond, and converted to nanoseconds its 1e6
            [Condition(Column("duration_ns"), Op.NEQ, 1e6)],
            id="!profile.duration:1",
        ),
        pytest.param(
            "profile.duration:>1",
            # since 1 mean 1 millisecond, and converted to nanoseconds its 1e6
            [Condition(Column("duration_ns"), Op.GT, 1e6)],
            id="profile.duration:>1",
        ),
        pytest.param(
            "profile.duration:<1",
            # since 1 mean 1 millisecond, and converted to nanoseconds its 1e6
            [Condition(Column("duration_ns"), Op.LT, 1e6)],
            id="profile.duration:<1",
        ),
        pytest.param(
            "profile.duration:1s",
            # since 1s mean 1 second, and converted to nanoseconds its 1e9
            [Condition(Column("duration_ns"), Op.EQ, 1e9)],
            id="profile.duration:1s",
        ),
        pytest.param(
            "environment:dev",
            [Condition(Column("environment"), Op.EQ, "dev")],
            id="environment:dev",
        ),
        pytest.param(
            "!environment:dev",
            [
                # environment is a nullable column
                Or(
                    conditions=[
                        Condition(is_null("environment"), Op.EQ, 1),
                        Condition(Column("environment"), Op.NEQ, "dev"),
                    ]
                )
            ],
            id="!environment:dev",
        ),
        pytest.param(
            "platform.name:cocoa",
            [Condition(Column("platform"), Op.EQ, "cocoa")],
            id="platform.name:cocoa",
        ),
        pytest.param(
            "!platform.name:cocoa",
            [Condition(Column("platform"), Op.NEQ, "cocoa")],
            id="!platform.name:cocoa",
        ),
        pytest.param(
            f"trace:{'a' * 32}",
            [Condition(Column("trace_id"), Op.EQ, "a" * 32)],
            id=f"trace:{'a' * 32}",
        ),
        pytest.param(
            f"!trace:{'a' * 32}",
            [Condition(Column("trace_id"), Op.NEQ, "a" * 32)],
            id=f"!trace:{'a' * 32}",
        ),
        pytest.param(
            "transaction:foo",
            [Condition(Column("transaction_name"), Op.EQ, "foo")],
            id="transaction:foo",
        ),
        pytest.param(
            "!transaction:foo",
            [Condition(Column("transaction_name"), Op.NEQ, "foo")],
            id="!transaction:foo",
        ),
        pytest.param(
            "release:foo",
            [Condition(Column("version_name"), Op.EQ, "foo")],
            id="release:foo",
        ),
        pytest.param(
            "!release:foo",
            [Condition(Column("version_name"), Op.NEQ, "foo")],
            id="!release:foo",
        ),
        pytest.param(
            "project_id:1",
            [Condition(Column("project_id"), Op.EQ, 1)],
            id="project_id:1",
        ),
        pytest.param(
            "!project_id:1",
            [Condition(Column("project_id"), Op.NEQ, 1)],
            id="!project_id:1",
        ),
        pytest.param(
            "foo",
            [
                Condition(
                    Function("positionCaseInsensitive", [Column("transaction_name"), "foo"]),
                    Op.NEQ,
                    0,
                )
            ],
            id="foo",
        ),
    ],
)
@django_db_all
def test_where_resolution(params, query, conditions):
    builder = ProfilesQueryBuilder(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=["count()"],
        query=query,
    )

    for condition in conditions:
        assert condition in builder.where, condition


@pytest.mark.parametrize("field", [pytest.param("project"), pytest.param("project.name")])
@django_db_all
def test_where_resolution_project_slug(params, field):
    project = params["project_objects"][0]

    builder = ProfilesQueryBuilder(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=["count()"],
        query=f"{field}:{project.slug}",
    )
    assert Condition(Column("project_id"), Op.EQ, project.id) in builder.where

    builder = ProfilesQueryBuilder(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=["count()"],
        query=f"!{field}:{project.slug}",
    )
    assert Condition(Column("project_id"), Op.NEQ, project.id) in builder.where


@pytest.mark.parametrize("field", [pytest.param("project"), pytest.param("project.name")])
@pytest.mark.parametrize("direction", [pytest.param("", id="asc"), pytest.param("-", id="desc")])
@django_db_all
def test_order_by_resolution_project_slug(params, field, direction):
    builder = ProfilesQueryBuilder(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=[field, "count()"],
        orderby=f"{direction}{field}",
    )

    assert (
        OrderBy(
            Function(
                "transform",
                [
                    Column("project_id"),
                    [project.id for project in params["project_objects"]],
                    [project.slug for project in params["project_objects"]],
                    "",
                ],
            ),
            Direction.ASC if direction == "" else Direction.DESC,
        )
        in builder.orderby
    )


@pytest.mark.parametrize(
    "field,column",
    [
        pytest.param(
            column.alias,
            column.column,
            id=f"has:{column.alias}",
            marks=pytest.mark.skip(reason="has not working yet"),
        )
        for column in PROFILE_COLUMNS
    ],
)
@django_db_all
def test_has_resolution(params, field, column):
    builder = ProfilesQueryBuilder(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=["count()"],
        query=f"has:{field}",
    )
    if field in ProfilesDatasetConfig.non_nullable_keys:
        assert Condition(Column(column), Op.NEQ, "") in builder.where
    else:
        assert Condition(is_null(column), Op.NEQ, 1) in builder.where


@pytest.mark.parametrize(
    "field,column",
    [
        pytest.param(
            column.alias,
            column.column,
            id=f"!has:{column.alias}",
            marks=pytest.mark.skip(reason="!has not working yet"),
        )
        for column in PROFILE_COLUMNS
    ],
)
@django_db_all
def test_not_has_resolution(params, field, column):
    builder = ProfilesQueryBuilder(
        dataset=Dataset.Profiles,
        params=params,
        selected_columns=["count()"],
        query=f"!has:{field}",
    )
    if field in ProfilesDatasetConfig.non_nullable_keys:
        assert Condition(Column(column), Op.EQ, "") in builder.where
    else:
        assert Condition(is_null(column), Op.EQ, 1) in builder.where